Siri & Alexa и защо гласовият асистент трябва да е полово и расово неутрален?

Проектите за разработване на неутрални по пол и раса гласови асистенти, които да заменят доминиращите бели и китайски мъжки гласове, не решават истински проблем - те създават такъв!


Тъй като продукти като Alexa и Siri са изправени пред нарастваща критика, че технологията, която стои зад тях, непропорционално разбира неправилно жените и етническите малцинства, компаниите за гласов софтуер разработват неутрални по отношение на пола гласови системи, за да гарантират, че индустрията за гласови технологии ще стане по-приобщаваща, дори когато слуша и говори.


Това може да звучи положително, но е крайно абсурдно. Какъв точно е проблемът, който тези компании се опитват да решат?


Сложността на разработването на потребителски интерфейси с гласово захранване (VUI) може ли да насърчи хуманизирането на изчислителната мощност? Или проблемът им е, че човешкият глас е биологично полово и културно обусловен?


В такъв случай предизвикателството не е реинженеринг на VUI, а социалната и политическа реалност и безумното й изкривяване, настъпващо напоследък.
Това може да дойде като шок за „будната" общност на Изкуствения интелект, но истината е: Полово и расово неутрални гласови системи не съществуват в реалния свят, където живеят всички! Човешкият глас има пол. Това не е избор или предразсъдък. Това е биологична реалност. И да, много гласове бяха маргинализирани в историята, не само заради пола, но заради расата и културата. Това са социални, политически и културни проблеми, които трябва да бъдат решени, но те не могат да бъдат решени чрез софтуер.


Фокусирайте се върху решаването на истинския проблем - да накарате ИИ да ни разбира.


Вместо глупавото „будно" нагаждане, тези софтуерни компании трябва да се опитват да решат истинските проблеми, които все още възпрепятстват пълния потенциал на гласовите интерфейси, като фоновия шум и регионалните акценти. Опитайте да говорите с Алекса или Сири когато сте настинали.


Фактът, че компютрите не са наравно с хората в разбирането на контекстуалната връзка на думите и изреченията, е това, което наистина причинява погрешни тълкувания на това, което говорителят е искал да каже или постигне - на какъвто и да е език или пол-глас. В системите за разпознаване на реч липсват хилядолетия контекстуален опит.


Потребителските интерфейси за глас трябва да ни улесняват. Вместо това сме принудени да забавяме речта си, да изричаме всяка гласна и съгласна, сякаш говорим с трудно чуващ чужденец с рудиментарно разбиране на английски език, за да постигнем това, което бихме могли да направим на клавиатура за половината време и без никакво притеснение.


Това за съжаление е просто още един пример за това как науката се принуждава да служи на измислената културна война. Попитайте Сири какво мисли за културната война. Той няма отговор за това. Но „шефовете" му смятат, не само, че такъв има, но още по-лошо - че го знаят.

Станете почитател на Класа