Мысли о том, что в процессе анализа данных компьютер может обучаться, как живое существо, посещали академиков еще полвека назад. Но дороговизна и ограниченная мощность комплектующих долгое время возвращали теоретиков машинного обучения с небес на землю. Приемлемые условия для реализации подобных идей и коммерческий спрос на них возникли только в последние 10 лет. Появились новые продвинутые алгоритмы, машинное обучение стало неотъемлемой составляющей искусственного интеллекта, а компьютеры стали достаточно дешевыми и производительными. Наконец, Facebook, Google и другие ИТ-гиганты смогли накопить огромные массивы данных — Big data — и теперь думают, потирая руки, как извлечь из ситуации наибольшую выгоду.
Выгоды стали очевидными. Технологии машинного обучения позволяют компаниям добывать ценные идеи из информации о потребителях — к примеру, для улучшения существующих или создания новых товаров и услуг. Поскольку значительная часть этой информации представлена видео- и аудиозаписями, фотографиями и текстовыми данными — привычными для человека, но слишком сложными для традиционных вычислительных систем — ее невозможно обработать старыми методами. Но обучающиеся компьютеры идут другим путем, используя новые подходы к анализу данных, вдохновленные работой органического мозга.
В результате такие системы приближаются к точному распознаванию визуальных образов, устной и письменной речи, в общем — любых данных, существующих в естественной для человека, а не машины, форме.Обучаясь, компьютеры адаптируются под смену условий в поставленных перед ними задачах и все точнее интерпретируют входящую информацию: распознают контекст фраз, эмоции пользователя или ситуации, в которых тот оказывается, и реагируют адекватным образом.
Чтобы машины могли обучаться, подобно человеку, они пытаются моделировать мыслительные процессы, которые происходят у нас в голове. Кора мозга состоит из нервных клеток — нейронов — связанных между собой отростками-синапсами. Считается, что мысли возникают в результате обмена электрическими сигналами между этими клетками. Технологии машинного обучения используют сильно упрощенную модель этой природной вычислительной архитектуры, которую называют искусственной нейронной сетью. Эту модель реализуют на двух уровнях: программном и аппаратном. В первом случае подобиями нейронов выступают взаимосвязанные математические функции, во втором — процессорные ядра.
Одним из знаковых для машинного обучения стал 2011 год. Суперкомпьютер Watson, разработанный компанией IBM, победил в популярном интеллект-шоу Jeopardy! (российским телезрителям должен быть знаком аналог этой передачи под названием «Своя игра»). Отвечая на вопросы, заданные естественным языком, машина обошла по баллам живых игроков. После этого события в СМИ стали обсуждать когнитивные системы — так IBM называет свои разработки, в основе которых, в том числе, лежат технологии машинного обучения.
Со временем Watson дорос до коммерческого использования и превратился в ряд облачных сервисов: готовых решений и отдельных функций, доступных для интеграции в продукты сторонних разработчиков. Проекты на базе Watson используют страховые компании, банки, университеты и прочие организации, которые сталкиваются с анализом данных. К примеру, суперкомпьютер помогает онкологам в Международном госпитале Бумрунград в Таиланде. Система анализирует истории болезней и сопоставляет их с академическими исследованиями и экспертной информацией, которая заключает в себе опыт сотрудников учреждения. Как результат машина выдает рекомендации для терапии. Среди них могут быть и такие идеи, которые просто ускользнули бы от врачей без подсказок Watson.
Другим примечательным событием 2011 года стало создание по инициативе Facebook организации Open Compute Project. Участниками проекта стали сотрудники Microsoft, Apple и других крупных компаний, которые имеют дело с облачной инфраструктурой и большими объемами данных. Хотя Facebook известна прежде всего как разработчик сервисов, она не заказывает дизайн «железа», на котором они работают, у сторонних вендоров, а проектирует его самостоятельно. В рамках Open Compute Project компании обмениваются результатами исследований и опытом разработки аппаратного обеспечения для дата-центров, чтобы сократить расходы и ускорить производство.
Такой шаг Facebook стал важным этапом в сотрудничестве между крупнейшими разработчиками в области искусственного интеллекта и машинного обучения, в частности. В 2015 году это взаимодействие вышло на новый уровень: сразу несколько компаний одна за другой анонсировали аппаратные и программные проекты, открытые для внешних специалистов.
В ноябре Google предоставила свободный доступ к библиотеке подпрограмм для машинного обучения TensorFlow, разработанной командой Google Brain Team. Технология постоянно дорабатывается, и в компании верят, что открытие исходного кода — оптимальный путь для дальнейшего развития движка. Ранее имели место похожие инициативы с участием других организаций вроде проекта Torch, в рамках которого Google, Facebook, Twitter и IBM до сих пор делятся своими наработками. Но как отмечает Wired, такой крупный релиз, как TensorFlow,достоин особого внимания, ведь судя по последним достижениям поискового гиганта, Google дальше всех продвинулась в сфере ИИ.
Текущие возможности компании может оценить любой желающий с помощью ее многочисленных сервисов. Машинное обучение помогает им точнее распознавать устные запросы, выдавать релевантные результаты в поиске и переводить речь с одних языков на другие. Кроме того, летом Google приятно удивила пользователей своим приложением Google Photos с продвинутыми функциями поиска изображений по названиям запечатленных на них объектов. Часть технологий, которые лежат в основе этих сервисов, после релиза TensorFlow могут использовать все, кто достаточно хорошо разбираются в программировании. В компании считают, что это приведет к популяризации машинного обучения.
Через несколько дней после анонса TensorFlow Microsoft открыла доступ к своим программным инструментам, которые помогают распределять тяжелые вычисления между несколькими машинами. Немногим позже появилась новость о запуске еще одной открытой системы обучения SystemML, на этот раз от IBM. Продолжением тенденции стал декабрьский анонс Facebook, в котором компания рассказала о своем новом аппаратном дизайне дата-центров, оптимизированном для работы с нейронными сетями. Система получила кодовое название Big Sur, она полагается на мощность графических процессоров Nvidia Tesla. Facebook планирует поделиться технологией с партнерами по проекту Open Compute Project. Как пишут западные издания, Big Sur сможет работать вместе с TensorFlow.
Прогресс в области искусственного интеллекта наводит на двойственные мысли. С одной стороны, можно представить потенциальные блага, с другой — возможные опасности. В середине года Илон Маск, Стивен Хокинг, Стив Возняк и другие известные в научно-технологической среде личности выразили свои опасения насчет создания автономных систем вооружения. В их заявлении сказано, что такие технологии могут появиться уже через несколько лет и стать третьей революцией в военном деле после изобретений пороха и ядерного оружия. В декабре на деньги Маска и еще нескольких миллиардеров Силиконовой долины была основана некоммерческая организация OpenAI. Согласно официальному сайту, ее целью будет не финансовый успех, а совершенствование ИИ во благо человечества. Исследовательскую работу в проекте возглавляет эксперт в сфере машинного обучения и бывший сотрудник Google Илья Суцкевер.
Если автоматическое уничтожение целей по заданным критериям — дело ближайшего будущего, то говорить о сильном искусственном интеллекте, который может сравняться с человеческим, все еще очень рано. Существующие разработки далеки от предела возможного и позволяют ИИ мыслить лишь в жестко ограниченных рамках. Разумеется, ни о каком самосознании речь не идет. Но даже в таком виде влияние искусственного интеллекта становится ощутимым. Современные рекомендательные, поисковые, аналитические и другие сервисы не были бы таковыми без новых технологий машинной интерпретации данных.
По прогнозам аналитиков, следующие годы в истории машинного обучения будут тесно связаны с развитием интернета вещей и мобильных ассистентов. Распространение датчиков и чипов дает сервисам более полное представление о мире, в котором живут пользователи, в результате чего умные системы могут подстраиваться под условия окружающей среды. Например, Siri и Google Now, учитывая наши интересы и данные о местонахождении, умеют автоматически запускать подходящие для ситуации функции. В этом же направлении работает Microsoft, совершенствуя Cortana; Facebook, судя по всему, тоже намерен подключиться к гонке со своим ассистентом M. Прогресс в машинной обработке речи может сделать голосовое управление основой взаимодействия с гаджетами, а умных помощников — центром интерфейса.