Тенденции и ползи
Субтитрите в реално време не са нова технология. Хората от трите култури нечуващи по света (тежко чуващи, оглушали и Глухи) рутинно използват в ежедневието си различни приложения за транскрибиране на реч в текст. Често обаче повечето приложения не им позволяват да извършват паралелно други дейности. Затова наличието на субтитри в зрителното поле е революционна технология, позволяваща на нечуващия човек да комуникира с близки, докато реже зеленчуци, например. С други думи, да бъде по-оперативен в множество дейности едновременно, без да концентрира вниманието си единствено в устно разчитане/декодиране.
Повечето очила със субтитри на живо се състоят от рамки, малък микрофон, вграден компютър, който обработва реч, батерия и някакъв начин за показване на текст. Някои очила съдържат всички тези компоненти, докато други устройства се поставят върху обикновени очила. Подобренията в софтуера за разпознаване на реч наистина позволиха множество технологични постижения във времето досега.
Очаква се до 2050 г. броят на хората със слухови дефицити по света да достигне близо 2,5 милиарда души. Един на всеки осем човека в Съединените щати на възраст 12 или повече години има загуба на слуха и в двете уши. Преобладават възрастните хора, които се нуждаят от слухови апарати или усилватели, но отказват да ги носят заради стигми или трудности с адаптирането. Предполага се, че именно те биха били най-заинтересовани от субтитриращите очила, тъй като приличат на обикновените и за разлика от средствата за чуване, не привличат околното внимание по смущаващ начин.
Очилата със субтитри в реално време много често се възприемат като заплаха както за съществуващите технологии за чуване - слуховите апарати, усилватели и кохлаерни импланти, така и за жестовите преводач-тълкуватели. Причината е опасението, че популярността на тази нова технология може да откаже нечуващи потребители от подпомагащи технически средства или човешки знакови посредници.
Подобни опасения са безпочвени, тъй като подпомагащите технологии се определят от необходимостта и културата на нечуващите: слуховите апарати и усилватели обслужват тежкочуващи лица, за да им доставят или усилват околните звуци, а знаковите посредници предават за родените без слух емоцията чрез мимика и смисъла на думите чрез жест. Субтитрите обслужват най-вече онези нечуващи култури, които идват от чуващи среди и разчитат предимно на тях. За всички останали те са възможност за комбинирано използване с други средства за комуникация.
Очилата с надписи в този случай не заместват средствата за чуване, а запълват пропуските в общуването, когато ползвателят на слухови апарати или усилватели не успява в хода на разговор да чуе или разчете всички думи и остава с усещане за пропуски и "накъсвания".
През годините досега множество компании са предлагали свои разработки на субтитриращи очила, но всички те са имали редица технически недостатъци – непрецизна микрофония и нерешена шумоизолация; недостатъчно добре разчетена реч, за да се подобри транскрипцията ѝ в текст; не са обслужвали множество езици, не са поддържали режим офлайн, не са били олекотени откъм компоненти, имали са слаби батерии и др.
Развитието на технологиите и изкуствения интелект са позволили до голяма степен тези недостатъци да бъдат изчистени с времето. Но нека се върнем малко назад, за да проследим появата на технологията.
Начало и развитие до днес
Още през 2010 г. Тад Старнър, професор по компютърни науки в Технологичния институт на Джорджия, разработва устройство, наречено Google Glass, наподобяващо очила, което проектира информация върху малка призма пред окото на носещия. То вече е спряно от производство, но е било замислено с идеята да подпомага както родени без слух или придобили слухова загуба в хода на живота си, така и хора с възрастово обусловена загуба на слух, за да подобряват социалните си отношения със семейство и приятели.
През 2013 г., когато Google Glass се появяват на пазара, едно 12-годишно момче oт Ню Делхи (Индия), по име Мадхав Лавакаре (Madhav Lavakare), е силно впечатлено от очилата – не естетически, а концептуално. Той учел в училището "Санскрити" и от малък бил "инженерен гений". Израства в Пало Алто, Калифорния (САЩ). Когато бил на шест, изобретил фурна, захранвана от слънчева енергия.
На 17 години Лавакаре създава свой прототип на очилата, наречена TranscribeGlass. Целта е да се позволи на хората със слухови дефицити да четат думите, които не могат да чуят. Самият Мадхав имал приятел в училище, комуто било трудно да следи уроците, защото изпускал множество думи и накрая трябвало да напусне училището.
За да разработи субтитриращите очила, Мадхав е използвал евтини електронни части и основни понятия от физиката, които е чел в десети клас. Google Glass тогава са недостъпни за обикновения човек поради цената си – 1500 долара. Лавакаре се надявал неговото устройство да помага на нечуващи хора с ниски доходи, а Transcribe Glass би била истинска благодат за Индия, където над 50 милиона души са с разнообразни слухови дефицити и затруднения.
Лавакаре се впуснал в търсене на съществуващи решения, само за да се сблъска с прекомерни разходи и несъвършени резултати. Тъй като е малолетен по онова време, той не можел да получи финансиране за изобретението си. Разработката му е оценена, когато в публикация на сп. Форбс-Индия от 2018 г. той е представен заедно с няколко други индийски тийнейджъри, които заради непълнолетието си не могат да сключват договори с компании и ползват набиране на публични средства на принципа на краудфъндинг сайтове, където се представят изобретения или проекти, нуждаещи се от финансиране, при пряка връзка с дарителите.
Когато започнал да работи по TranscribeGlass, Лавакаре комбинирал знанията си за хардуер, електроника, машиностроене и 3D печат, за да създаде прототип. Най-трудната част била да научи как ще работи оптиката на устройството. Разглобил един стар, малък проектор и го разгледал отвътре, опитвайки се да разбере какво се случва там.
Като студент в "Йейл" той работи седем години по прецизната разработка на субтитриращите очила. В продължение на пет години провеждал полеви изпитания с над 500 Глухи и тежко чуващи хора от нечуващите общности на Съединените щати, Европа, Австралия и Индия и е създал седем версии на прототипа.
По време на пътуване Лавакаре срещнал Том Притски (Tom Pritsky), по онова време докторант по биомедицинска информатика от Станфордския университет, и двамата превръщат Transcribe Glass в компания за разработка на прототипите. Притски бил с тежка двустранна слухова загуба и носел слухови апарати, които му давали звук, но често неясен, поради което пропускал думи. Бил изумен, когато пробвал за пръв път субтитриращите очила и осъзнал в колко много ситуации могат да улеснят нечуващите.
Полезна обратна връзка се получила, когато Притски тествал очилата по време на разходка със свой нечуващ приятел. За да се разчитат по устни, за нечуващите хора от всички култури е необходио да имат визуален контакт един с друг. Това обикновено не позволява комуникация в движение, поради отклоняване на вниманието от посоката. Очилата обаче позволили на Притски и приятеля му да разговарят, разхождайки се, тъй като всеки виждал казаното от другия в зрителното си поле, без дори да се поглеждат един друг.
През 2024 г. към екипа на Лавакаре като главен технологичен директор се присъединил Нирбхай Наранг (Nirbhay Narang), тогава студент в "Корнел", който се занимавал със софтуер. През 2025 г. технологията на очилата била комерсиализирана чрез spinoff компанията на Наранг Air Caps. Тя предлага под своята марка прецизирана версия на очилата Transcribe Glass.
Какви са характеристиките очилата Air Caps?
Свързване: Те приличат на обикновените и се свързват посредством Bluetooth с телефона на потребителя (с версии за Anroid и iPhone). Микрофонът улавя гласа на говорещия в близост, а с помощта на AI алгоритъм речта се транскрибира в текст в реално време върху екран от вътрешната стана на лещите. Текстът се показва и на екрана на телефона.
Дизайн: Очилата са с вграден бинокулярен дисплей (с по един за всяко око). Това осигурява по-комфортно и естествено зрително изживяване - без главоболие или напрежение в очите. Диспелят е монохромен (в зелено), оптимизиран за висок контраст и отлична четливост. Поддържа диоптри от -16 до +16, включително всички видове прогресивни, бифокални и варифокални лещи.
Зареждане: Субтитриращите очила издържат 8 часа, базирани на средно очаквана дневна употреба. Батерията им се зарежда за 40 минути, отделно може да се закупи и калъф за зареждане, който поддържа 10 пълни зареждания на очилата. Сменяемите батерии се закупуват отделно. Те се закрепват магнитно към очилата и осигуряват допълнително захранване - до 8 пълни зареждания.
Езици и режими: Очилата поддържат над 60 езика, включително български, но в режим онлайн. Офлайн се поддържат само 9 езика - английски, испански, китайски, френски, немски, италиански, японски, корейски и португалски. Технически термини, жаргон или други думи, които в момента не са в речника на устройството, могат да бъдат добавяни ръчно от потребителите.
Шумоизолация: Притежават превъзходна технология за намаляване на шума. Транскрипциите са изключително точни дори при силно шумни разговори. Потребителите могат да разбират реч в претъпкани ресторанти, барове, концерти и събития, където дори слуховите апарати често са неефективни. Очилата използват 4 дискретно вградени микрофона с усъвършенствана технология с изкуствен интелект, за да се изолира речта, като същевременно се филтрира фоновия шум, музиката или други разговори. Това осигурява кристално ясни субтитри дори в най-шумна среда.
Достъпност: Очилата са достъпни за купувачи от САЩ чрез уебсайта на компанията и се предлагат на начална цена от 699 щатски долара, с възможност за абонамент. Потребители извън САЩ също могат да ги поръчват, но са отговорни за заплащането на вносни мита, митнически такси или тарифи. В срок от 15 дни поръчката може да бъде върната, като се възстановяват напълно сумите за целия хардуер.
В заключение
Освен очилата на AirCaps, интелигентни очила предлага и компанията XRAI, лидер в технологиите за достъпност с добавена реалност. Миналата година, на водещото световно събитие за иновации и технологии AWE 2025, компанията показа ново поколение интелигентни очила, което предоставя до 98% точност на субтитрите на над 220 езика, с олекотен дизайн и тегло 49 грама.
Създадени там, където нуждата е била най-голяма: да помагат на хората със загуба на слуха да видят всяка дума чрез субтитри в реално време, интелигентните очила вече увеличават обхвата си на приложение – те могат да са в помощ и на множество пътуващи и изучаващи чужди езици хора.
Лавакаре и Наранг към момента продължават да прецизират очилата, като акцентират върху прозодията – разпознаване на тона на речта, за да може потребителят да разбира и какво чувство влага в думите си говорещият му. Това би позволило очилата да бъдат ползвани и от хора с аутизъм и разпокъсване на вниманието (ADHD).
Интелигентните субтитриращи очила подобряват разговорите, без да ги накъсват, държат ръцете свободни, поддържат зрителния контакт и предоставят информация точно когато е необходима.
Автор на статията с преводи от английски: Христина Чопарова
Изображения: AirCaps, Forbes India, World Teen, Keyt.com
Сдружение НЦАК „Ние ви чуваме“ е носител на неизключително право да публикува статията
