
Представьте: вы звоните в службу поддержки, и ещё до того, как произнесёте первое слово, система уже знает, что вы раздражены. Не потому, что следила за вами, а потому, что распознала микроинтонации в вашем голосе — те едва уловимые изменения, которые выдают истинное состояние человека. За этой технологией стоит Бьёрн Шуллер — учёный, превративший анализ звука в один из самых перспективных инструментов искусственного интеллекта XXI века.
В конце 1990-х, когда большинство специалистов по компьютерным наукам увлекались распознаванием речи — то есть тем, что говорит человек, — молодой немецкий исследователь задался другим вопросом: а можно ли научить машину понимать, как он это говорит? Тембр, скорость, паузы, дыхание — вся эта акустическая палитра, которую человеческое ухо улавливает интуитивно, оставалась терра инкогнита для искусственного интеллекта.
Шуллер получил образование в области электротехники и информационных технологий, но его всегда интересовало то, что находится на стыке дисциплин. Не просто сигналы и алгоритмы, а то, как через технологии можно проникнуть в природу человеческого общения. Эта междисциплинарность станет его визитной карточкой.
Аугсбургский университет в Баварии — не самое очевидное место для технологической революции. Город, известный своей ренессансной архитектурой и банковской династией Фуггеров, казалось бы, далёк от передовых рубежей ИИ. Но именно здесь Шуллер возглавил кафедру встроенного интеллекта для здравоохранения и благополучия, превратив её в один из ведущих европейских центров аффективных вычислений — области, изучающей способность компьютеров распознавать и имитировать эмоции.
Его подход отличался практичностью. Вместо того чтобы создавать громоздкие системы для лабораторных условий, команда Шуллера работала над встроенными решениями — технологиями, которые могут функционировать в реальном времени, на обычных устройствах, в повседневных ситуациях. Смартфон в кармане, микрофон в автомобиле, датчики в умном доме — всё это становилось потенциальными точками сбора акустических данных.
Особое внимание он уделял применению технологий в медицине. Может ли голос выдать первые признаки депрессии? Способны ли изменения в речи предсказать болезнь Паркинсона за годы до появления двигательных симптомов? Эти вопросы превращались из теоретических в практические под руководством Шуллера.
Параллельно с работой в Германии, Шуллер получил профессорскую должность в Имперском колледже Лондона — одном из самых престижных технических университетов мира, где когда-то преподавал Александр Флеминг, а выпускником был Брайан Мэй из Queen. В Имперском колледже Шуллер возглавил направление искусственного интеллекта, работая в эпицентре британской tech-индустрии.
Лондон 2010-х — это эра стремительного роста ИИ-стартапов, город, где DeepMind создавала своего AlphaGo, где каждый месяц появлялись новые компании, обещавшие революционизировать ту или иную отрасль. В этой среде академическая карьера Шуллера обрела новое измерение: он стал мостом между университетской наукой и индустрией, между фундаментальными исследованиями и коммерческим применением.
Такое положение — одновременно профессор в Лондоне и заведующий кафедрой в Аугсбурге — требовало колоссальной организованности. Но для Шуллера это был способ соединить немецкую научную традицию с британским предпринимательским духом.
В 2012 году Шуллер вместе с коллегами основал audEERING GmbH — компанию, название которой игриво соединило английское "audio" (звук) с немецким суффиксом "-ierung" (процесс, действие). Штаб-квартира разместилась в технопарке Аугсбурга, но амбиции были глобальными.
audEERING специализировалась на том, что в индустрии называют "affective computing" — аффективными вычислениями. Их флагманский продукт, openSMILE, стал открытой платформой для извлечения акустических признаков из аудиосигналов. Технология позволяла анализировать голос в режиме реального времени, определяя не только эмоциональное состояние говорящего, но и его физическое самочувствие, уровень стресса, даже признаки когнитивной нагрузки.
Клиентами компании стали автомобильные концерны (системы, отслеживающие усталость водителя по голосу), производители смартфонов (персонализированные голосовые ассистенты), медицинские учреждения (мониторинг психического здоровья пациентов). Шуллер занял пост главного научного директора (CSO), оставаясь тем человеком, который задаёт научный вектор развития компании.
Балансировать между ролью учёного и предпринимателя — особое искусство. Академическая наука требует открытости, публикации результатов, обмена данными. Бизнес живёт патентами, коммерческими тайнами, конкурентными преимуществами. Шуллер нашёл свою формулу: фундаментальные исследования оставались в университетах, прикладные разработки — в компании, а часть инструментов выпускалась как открытое ПО, создавая научное сообщество вокруг технологии.
Более 800 научных публикаций. В мире академической науки это не просто впечатляющая цифра — это признак систематической, методичной работы на протяжении десятилетий. Каждая статья проходит рецензирование, каждое исследование должно быть воспроизводимым, каждый вывод — обоснованным.
Но ещё более показательны 20 000+ цитирований в Google Scholar. Это означает, что работы Шуллера не пылятся в архивах — на них опираются другие исследователи по всему миру. От Стэнфорда до Токийского университета, от MIT до Цюрихской высшей технической школы — учёные ссылаются на его методы, используют его датасеты, развивают его идеи.
Среди его публикаций — основополагающие работы по INTERSPEECH (крупнейшей конференции по обработке речи), статьи в IEEE Transactions (наиболее авторитетных журналах по электротехнике и информатике), главы в фундаментальных справочниках по машинному обучению. Шуллер стал одним из тех учёных, чьи работы обязательны к изучению для любого, кто входит в область аффективных вычислений.
Технологии распознавания эмоций по голосу открывают фантастические возможности — и поднимают сложные вопросы. Если система может определить, что вы нервничаете во время собеседования, должен ли работодатель иметь доступ к этой информации? Если алгоритм фиксирует признаки депрессии в вашем голосе при звонке в страховую компанию, как это повлияет на стоимость полиса?
Шуллер, работая на переднем крае этой технологии, не раз поднимал вопросы этики и приватности. В своих выступлениях он подчёркивал: инструмент сам по себе нейтрален, но его применение требует чётких правовых и этических рамок. В Европе, где действует строгий GDPR (Общий регламент по защите данных), эти вопросы стоят особенно остро.
Его позиция: технология должна помогать людям, а не следить за ними. Система, которая предупреждает водителя о его усталости, — благо. Система, которая докладывает работодателю о каждом эмоциональном колебании сотрудника, — угроза. Граница тонка, и именно учёные вроде Шуллера помогают обществу её нащупать.
Те, кто работал с Шуллером, отмечают его способность держать в голове невероятное количество проектов одновременно. Утром — лекция в Имперском колледже, днём — видеоконференция с командой в Аугсбурге, вечером — работа над статьёй для научного журнала, между делом — консультации для audEERING по новому продукту.
Его день начинается рано — привычка, выработанная годами жизни между двумя странами и несколькими часовыми поясами. Он известен пунктуальностью (немецкая черта) и готовностью к импровизации (необходимость для любого, кто работает в быстро меняющейся области ИИ).
Шуллер свободно владеет несколькими языками, что в его междисциплинарной области критически важно: нужно читать исследования на английском, общаться с немецкими коллегами и партнёрами, понимать технические термины, которые часто не имеют устоявшихся переводов.
За годы преподавания через руки Шуллера прошли десятки аспирантов и постдоков. Многие из них теперь работают в ведущих tech-компаниях и исследовательских центрах по всему миру, распространяя его подход к аффективным вычислениям.
Его стиль руководства исследовательскими проектами — сочетание свободы и структуры. Он даёт студентам пространство для собственных идей, но требует строгости в методологии. В мире машинного обучения, где легко увлечься модными трендами и забыть о научной чистоте эксперимента, это особенно ценно.
Бывшие студенты вспоминают его способность задать тот самый вопрос, который переворачивает весь проект — не критикуя, а открывая новую перспективу. "А что если посмотреть на это с точки зрения клинической практики?" "А учли ли вы культурные различия в выражении эмоций?" "А как это будет работать на устройствах с ограниченными ресурсами?"
Сегодня, в 2026 году, мир Бьёрна Шуллера — это мир, где граница между человеческим и машинным восприятием звука становится всё более размытой. Его технологии встроены в устройства, которыми пользуются миллионы людей, хотя большинство даже не подозревают об этом.
Когда ваш смартфон предлагает включить режим "не беспокоить", уловив в вашем голосе напряжение. Когда автомобиль предупреждает о необходимости остановки, заметив признаки сонливости в вашей речи. Когда телемедицинское приложение рекомендует вам обратиться к специалисту, зафиксировав изменения в голосе, характерные для начала депрессии. За всем этим стоят годы исследований, сотни научных статей, тысячи часов работы учёных вроде Шуллера.
Он продолжает публиковаться, продолжает преподавать, продолжает развивать audEERING. Его работа — живое доказательство того, что в современной науке нет противоречия между академической карьерой и предпринимательством, между теорией и практикой, между глубиной исследований и широтой их применения.
Бьёрн Шуллер не стремился стать публичной фигурой, его имя редко встретишь в массмедиа. Но в узких кругах специалистов по ИИ, обработке речи и аффективным вычислениям оно значит очень много. Это имя человека, который помог машинам научиться слышать не только слова, но и эмоции, стоящие за ними. В эпоху, когда мы всё больше общаемся с искусственным интеллектом, это умение становится не просто научным достижением — оно меняет саму природу взаимодействия человека и технологии.
Фото Соцсети
Посмотреть фото