Разговорная техническая революция
Технологии

Разговорная техническая революция

Алан Тьюринг однажды заметил, что вместо того, чтобы задаваться вопросом, может ли машина думать, мы должны посмотреть, как она имитирует человеческий язык. Естественные языки кажутся нам, людям, относительно простыми, но это один из самых сложных навыков для машин. Революция чаттерботов (1), которая продолжается уже несколько лет, пытается справиться с этой проблемой.

В Соединенных Штатах около 70 миллионов взрослых используют умные колонки (2) — это почти четверть общества, которое при большей или меньшей вовлеченности разговаривая с машинами. Количество разговорных платформ (которые доступны не только в домашних колонках, таких как Echo от Amazon) продолжает расти.

Мы хорошо знаем платформы:

  • Google Assistant,
  • Амазонка Алекса,
  • Facebook Messenger,
  • Apple iMessage,
  • Слэк, Твилио,
  • Самсунг Биксби.

Системы голосовой связи на базе искусственного интеллекта уже несколько лет входят во многие сферы нашей жизни, от бытовой техники, через автомобиль, транспортную инфраструктуру, общественные места, до рабочих мест, как в офисах, так и в заводских цехах.

Bilet u czatbota

Согласно последним исследованиям, ожидается, что глобальная стоимость рынка интеллектуальных виртуальных помощников превысит 2025 триллиона долларов к 2019 году по сравнению с чуть более 2021 триллионом долларов в 123 году. EMarketer считает, что к 2020 году 2021 миллиона человек будут полагаться в первую очередь на голосовых помощников в своей личной и деловой деятельности. В отчете Gartner за февраль 70 года говорится, что к XNUMX году XNUMX процентов. компании воспользуются чаты i чат-боты в вашем бизнесе.

Автоматизируя задачи и избавляя людей от ненужных взаимодействий, компании надеются повысить эффективность и скорость своей работы. Диалоговые интерфейсы предоставляют предприятиям простой и экономичный способ получать отзывы клиентов, улучшать отношения с клиентами и повышать их лояльность. По данным Accenture, сама разговорный банкинг может ускорить рост выручки на 25% и сократить расходы до 30 процентов.

Умные формы бизнеса позволяют потребителям пользоваться услугами через общение на естественном языке. Используя свой собственный голос или SMS с любого устройства, такого как планшет, смартфон, смарт-часы или даже смарт-телевизор, клиенты могут ожидать информацию, покупать новые продукты и совершать транзакции. Например, интеллектуальный диалоговый банкинг можно легко интегрировать с наиболее часто используемыми клиентами каналами связи, такими как Facebook и Instagram, или с виртуальными помощниками, такими как Amazon Alexa или Google Assistant. (смотрите также: ).

Сегодня чат-боты чаще всего используются в обслуживании клиентов, ИТ-поддержке, продажах, маркетинге и коммерческом общении. Это важно, если компании серьезно относятся к внедрению таких типов решений в больших масштабах, заверяя клиентов и партнеров в том, что диалоговая платформа обеспечивает полную безопасность личной, финансовой и другой конфиденциальной информации.

— это метод общения с машиной, при котором вы можете разговаривать с устройством или со всей системой, или вести текстовое общение на простом языке. Его цель — обеспечить общение таким образом, как если бы мы разговаривали с другом или знакомым или хотя бы с человеком, работающим в служебном окне.

Компании используют разговорные технологии, известным примером которых является чатбот BlueBot KLM Airlines (3) для повышения качества обслуживания как сотрудников, так и клиентов. Диалоговые платформы — одно из наиболее распространенных применений приложений ИИ. Чат-боты обеспечить более быстрое, доступное круглосуточное обслуживание клиентов и сотрудников. Компании стремятся улучшить опыт онлайн-клиентов, а также сократить расходы.

3. Покупка билета через KLM BlueBot

Базовые боты, помощники и голосовые помощники

Диалоговые программы могут общаться как люди, понимая цель разговора, используя текст или имитируя человеческую речь. Конечная цель техники разговорного интерфейса, как уже упоминалось, состоит в том, чтобы она была неотличима от человеческого разговора. Тем не менее, проектирование взаимодействия, которое звучит естественно, является серьезной проблемой для говорящего или даже просто пишущего нам. искусственный интеллект.

Диалоговые интерфейсы делятся на три широкие категории: базовые боты (), текстовые помощники и голосовые помощники. Функции базовых ботов относительно ограничены. Дизайн интерфейса позволяет выполнять основные команды. Качество текстовых чат-ботов зависит от качества входных данных. В зависимости от качества баз данных текстовые помощники либо довольно хороши, либо посредственны. , такие как Google Assistant и Amazon Alexa, обеспечивают больше автоматизации и сокращают время набора текста, снижая барьеры для использования устройств. Однако существенным барьером их достоверности до сих пор являются не всегда совершенные методы распознавания человеческой речи.

Создать болтающего бота на самом деле несложно. Труднее сделать его полезным. Основные проблемы связаны с интеграцией различных источников данных. В бизнесе источниками данных могут быть, например, программное обеспечение для обслуживания клиентов (CRM) или platformy e-commerce. Несовершенство разработки диалогового интерфейса требует наблюдения со стороны человека, если целью является разработка полностью и надежно функционирующей системы. Целью тех, кто разрабатывает эти методы, должно быть максимальное упрощение чат-бота. Для этого требуется максимально простой коммуникационный интерфейс. Язык, который бот использует для формирования ввода, предоставленного пользователем. Таким образом, формирование поведения пользователя путем подачи правильных сигналов сделает беседу гладкой.

Благодаря машинному обучению платформы для общения (4) может обрабатывать постепенно увеличивающийся спектр запросов. Кроме того, они могут учитывать контекст (то есть оставшуюся часть разговора), определяя намерения пользователей и правильные ответы с возрастающей релевантностью. Учиться на ошибках — важный шаг в построении такого механизма. Особенно это касается сбора правильных данных и улучшения интерфейса. Поэтому проектировщики должны предоставить соответствующие инструменты и механизмы обратной связи для исправления ошибок и возникающих проблем.

В разработке интеллектуальные чат-боты используется обработка естественного языка (NLP). Это отдел искусственного интеллекта, который позволяет проводить аналитическую декомпозицию, понимание, обработку и определение действия, необходимого для введенных слов. НЛП служит, среди прочего, для управления диалогом и прогнозирования задач.

Подкатегорией НЛП является понимание естественного языка (NLU). Этот метод используется для анализа структуры предложения в текстовом и речевом форматах. NLU позволяет компьютеру интерпретировать значение намерения по отношению к универсальному человеческие ошибкиНапример, неправильное произношение или переставленные буквы. Механизмы NLU работают с большими наборами данных и требуют постоянной проверки. Технологические гиганты, такие как Google, улучшают эти механизмы, используя свои огромные ресурсы данных.

Еще один метод, используемый при разработке чат-ботов, — генерация естественного языка (, НЛГ). Это также подкатегория НЛП. Он позволяет генерировать текстовые или голосовые ответы пользователю. Чтобы быть убедительной и беглой, машинная речь должна создавать ответы, которые пользователи считают естественными, как нормальные человеческие ответы.

Легко сказать — сложнее понять

Расширение голосового интерфейса, разговорный (VUI) как способ взаимодействия с цифровыми устройствами считается технологической революцией нашего времени. Впервые с тех пор, как были изобретены компьютеры, машины стали серьезными и масштабными. Это означает, что если целью дизайнера VUI является создание, интерфейс должен отражать модели мышления и социокультурные практики, воплощенные в моделях человеческого взаимодействия в повседневных разговорах.

Встраивая модель взаимодействия в естественный интерактивный паттерн человеческого разговора, дизайнеры ВПИ естественным образом вводят в разговор языковые элементы, не требуемые сугубо прагматическими коммуникативными потребностями и логикой, например, различные вежливые, эмоциональные фразы или языковые формы, выражающие отношение к произносимым словам. . Другими словами, дизайнеры VUI пытаются привнести в разговор с машинами тот же груз чувств и эмоций, который мы знаем из межличностных диалогов.

Сегодня машины по-прежнему способны справляться с различными лингвистическими нюансами как в живом, так и в письменном, и в устном языке, что далеко не идеально. Тот, кто пользуется переводчиком Google, наверняка знает, о чем говорит. Проблема, с которой сталкиваются системы (АСР), заключается в извлечении полезных данных из речевого сигнала и ассоциировании его с конкретным словом, имеющим для человека конкретное значение. Произносимые звуки каждый раз разные. Вариативность речевого сигнала является его естественной особенностью, благодаря которой, например, мы распознаем акцент или интонацию. Каждый элемент системы распознавания речи имеет определенную задачу. На основе обработанного сигнала и его параметров создается акустическая модель, которая будет связана с языковой моделью.

Система распознавания речи может работать на основе малого или большого количества паттернов, что определяет размер словаря, с которым взаимодействует система. Это могут быть небольшие словари в случае систем, распознающих отдельные слова или команды, а также большие базы данных, содержащие эквивалент языкового набора и учитывающие языковую модель (грамматику).

Проблемы, с которыми они сталкиваются голосовые интерфейсы— это прежде всего правильное понимание речи, при котором, например, часто опускаются целые грамматические последовательности, появляются языковые и фонетические ошибки, ошибки, пропуски, речевые дефекты, омонимы, повторы и т. д. Все системы АСР должны работать быстро и надежно. По крайней мере, таковы ожидания.

W системы распознавания речи Еще одним источником затруднений являются акустические сигналы, отличные от распознаваемой речи, поступающие на вход системы распознавания, т.е. всевозможные помехи и шумы. В простейшем случае это искажения и шумы, которые необходимо отфильтровать. На самом деле эта задача кажется рутинной и легкой (ведь фильтруются различные сигналы и каждый электронщик знает, как это сделать), но делать ее нужно действительно тщательно и внимательно, чтобы результат распознавания речи оправдал наши ожидания.

Используемая в настоящее время фильтрация позволяет удалить вместе с речевым сигналом внешний шум, улавливаемый микрофоном, и внутренние свойства самого речевого сигнала, затрудняющие его распознавание. Гораздо более сложная техническая проблема возникает, когда возмущение только что проанализированного речевого сигнала… речевой сигнал. Этот вопрос известен в литературе как так называемый . Это требует применения сложных методов, т.н. деконволюция сигнала, что является довольно сложным вопросом.

На этом проблемы с распознаванием речевого сигнала не заканчиваются. Сейчас мы собираемся обсудить несколько вопросов, связанных с богатым контентом. речевой сигнал. Важно понимать, что речевой сигнал несет много различных типов информации. Голос говорящего содержит информацию о поле, возрасте и других личностных характеристиках говорящего. Речевой сигнал также содержит информацию о состоянии говорящего. На сегодняшний день существует такой, который занимается диагностикой различных заболеваний на основе характерных акустических явлений, обнаруживаемых в речевом сигнале.

Что касается системы, то она получает и интерпретирует команды и другие поступающие к ней высказывания одинаково, независимо от того, кто отдал команду и каковы индивидуальные особенности голоса говорящего. Однако есть приложения, где основной целью акустического анализа речевого сигнала является идентификация говорящего или проверка того, что он тот, за кого себя выдает (голос вместо ключа, пароля или PIK-кода), что может также использоваться в умные здания.

Первым элементом этой системы является микрофон. Речевой сигнал однако, поскольку он улавливается микрофоном, обычно мало полезен для рассматриваемых систем. Исследования показывают, что форма и курс звуковая волна рассматриваемая во временной области, очень сильно варьируется в зависимости от личности говорящего, от скорости речи, отчасти также в зависимости от настроения говорящего — при этом в малой степени отражает содержание произносимых команд.

Поэтому этот сигнал должен быть правильно обработан. , фонетика и вычисления вместе создают богатый набор инструментов, которые можно применять для обработки, анализа, распознавания и понимания речевого сигнала. Удобной основой для автоматического распознавания речи являются динамические спектры сигнала, так называемые динамические спектрограммы. Их приятной особенностью является то, что их можно относительно легко получить, а кроме того, речь, представленная в виде динамической спектрограммы, может быть относительно легко распознана с помощью методов, аналогичных тем, которые используются при распознавании изображений.

Простые элементы речи (например, команды) можно распознать по простому подобию целых спектрограмм. Например словарь мобильного телефона с голосовым управлением он содержит всего от нескольких десятков до нескольких сотен слов и словосочетаний, обычно наложенных заранее, чтобы их можно было легко и эффективно распознать. Этого достаточно для простых задач управления, но сильно ограничивает общее применение такой системы. Системы, построенные по схеме, как правило, поддерживают только конкретных дикторов, для которых они специально обучены. Если есть кто-то новый, кто хочет использовать свой голос для управления системой, очень вероятно, что эта попытка потерпит неудачу.

Результат этой операции называется спектрограммой. 2-Wили двумерный спектр. Однако в этом блоке есть еще одно действие, на которое стоит обратить внимание — сегментация. Вообще говоря, речь идет о разделении непрерывного речевого сигнала на части, которые будут подлежать раздельному распознаванию, а затем из этих отдельных распознаваний собирается тотальное распознавание. Такая процедура необходима, потому что невозможно распознать длинное и сложное высказывание за один раз. О том, какие сегменты следует различать в речевом сигнале при распознавании речи, уже написаны целые тома, поэтому мы не будем предрешать, должны ли выделяемые сегменты быть фонемами (звуковыми эквивалентами), слогами или, возможно, субфонемами.

Процесс автоматического распознавания всегда обращается к некоторым признакам распознаваемых объектов. Для речевого сигнала были протестированы сотни наборов различных характеристик и параметров. Разделив речевой сигнал на распознанные кадры и выбрав признаки, которыми эти кадры представлены в процесс признания, мы можем провести (для каждого кадра отдельно) классификацию, т.е. присвоив этому кадру идентификатор, который будет представлять его в дальнейшем.

Речевой сигнал преобразуется в последовательность идентификаторов кадров. Следующий этап — сборка фреймов в отдельные слова — чаще всего на основе модели неявных марковских моделей НММ (), пояснения для которых здесь не проводятся. Затем происходит сборка полных предложений из слов.

На примере Алекса система Процесс машинного «понимания» человека, а точнее отдаваемых им команд или задаваемых вопросов, проходит в несколько стадий.

Понимание слов, понимание смысла и концепция намерения пользователя — совершенно разные вещи. Поэтому следующий шаг — за работой модуля НЛП (), задачей которого является распознавание намерений пользователя, т.е. смысла команды/вопроса в том контексте, в котором она была произнесена. Если намерение распознано, следующим шагом будет назначение «навыка», конкретной функции, которую выполняет интеллектуальный помощник. При запросе погоды вызывается источник погоды. Когда данные получены, их остается обработать в речь (TTS — механизм преобразования текста в речь) и пользователь слышит ответ на заданный вопрос.

Интернет-хуки

Компании, разрабатывающие разговорный ИИ, поняли, что работу по развитию уровня человеко-машинного диалога могут выполнять только профессионалы с хорошим знанием естественного языка. В частности, они ищут дизайнеров CUX (), которые могут создавать естественные обмены.

Умный разговорный бот не должен звучать как робот. Вместо того, чтобы каждый раз произносить одни и те же предложения, бота можно настроить так, чтобы он выбирал их случайным образом из более широкого списка. Ответ, который должен сгенерировать бот, зависит не только от предыдущего сообщения пользователя, но и от контекста. Контекст охватывает многие вещи, такие как предыдущие разговоры чат-бота с пользователем, модальность платформы (голос или текст), знания или опыт пользователя в отношении продукта или услуги, а также этап всего процесса совместной работы, на котором находится пользователь.

После определения взаимодействий следующим шагом является построение потока общения с использованием абстракциитакие как намерения, переменные, веб-перехватчики для вызова API, деревья решений для решения проблем и база знаний для ответов на вопросы.

Намерения — это основная структура любого диалогового интерфейса, которая улавливает смысл сообщений, вводимых пользователем. Намерения могут состоять из ключевых слов, переменных и так называемых веб-хуки (элементы, которые используют внешние API-интерфейсы веб-сайтов или приложений для поиска ответов во внешних базах данных), приводящие к действию системы.

Ключевые слова — это разные фразыкоторые пользователь может произнести и система поймет, что они относятся к вашему намерению. Различные ключевые слова намерений вместе с фактическими сообщениями пользователей (помеченными) для обучающих данных для классификации намерений. В случае обслуживания клиентов мы можем определить намерения отслеживать заказ и / или поговорить с агентом по обслуживанию клиентов.

Переменные используются для определения входных данных, которые нам нужно получить от пользователя для этого. Например, для отслеживания заказа система должна получить идентификатор заказа от пользователя. После определения намерения и получения необходимых переменных мы должны выполнить действие. В этом случае мы можем сделать вызов API для статуса заказа, узнать о возникающих проблемах и т. д.

Многие варианты использования включают принятие определенных решений и реакцию на то, как пользователи предоставляют свою информацию. Деревья решений — отличный способ решить подобные проблемы. Наличие способа определения дерева решений и потока управления является важным строительным блоком для определения потока коммуникационного обмена.

Наконец, есть еще и база знаний как способ ввести часто задаваемые вопросы (FAQ) и найти правильный ответ на вопрос пользователя.

Вам нужен перевод, такси или завтрак в постель?

Развитие чат-ботов сопровождается увеличением использования методов голосового поиска, которые постепенно, не революционно, но с неумолимой последовательностью заменяют традиционные методы поиска информации. Уже в этом году, по прогнозам, он должен составить 50 процентов. веб-поиск. «Форбс» несколько месяцев назад прогнозировал, что к концу 2020 года около 30 процентов. веб-сайты по всему миру будут найдены с помощью голосовой поиск.

Потребители привыкают к использованию голосовой помощник в своих смартфонах. Дети, которые растут с Alexa и Google Assistant дома в развитых странах, скорее всего, продолжат разговоры с голосовым помощником, когда станут владельцами смартфонов. Согласно данным, предоставленным Google, 41 процент. взрослых и 55%. подростки каждый день используют голосовой поиск для таких задач, как установление контактов, поиск видео и поиск мест, где можно поесть.

Пользователи также используют голосовые команды для играть музыку, поиск информации и определение направления, что делает его отличным инструментом для путешественников. Уже в 2018 году процент путешественников, которые использовали только голосовые функции в своих смартфонах, достиг 50%. прибл. 70 процентов пользователи в таких странах, как Китай, Индия и Турция, используют голосовой поиск на ходу. В некоторых случаях, например, в Китае, из-за сложности почерка речь может быть гораздо более быстрым и простым способом извлечения информации из устройств, при условии, конечно, что интерфейс надежный.

Важным улучшением с этой точки зрения является перевод на лету (5). В последнее время достаточно попросить, например, Google Ассистента о помощи в ведении разговора на заданном языке. Например — «Окей, Google, будь моим испанским переводчиком» для запуска режим переводчика и иметь возможность регулярно разговаривать с иноязычным человеком (или используя интеллектуальные сканеры, переводы субтитров). Режим переводчика уже установлен на вашем телефоне, скачивать приложение не нужно.

5. Режим переводчика Google в приложении American Airlines

Google пошел еще дальше и объединил свои Карты i Переведите. Благодаря этой новой функции он автоматически переводит и читает вслух название места и адрес на местном языке. Также было введено расширение системы сопровождения пешеходов, разработанное специально для слабовидящих. Эти советы помогают слепым людям перемещаться с места на место, предупреждая их о потенциально загруженных местах. Таким образом, Google может выйти на совершенно новую территорию, упростив передвижение людей с ограниченными возможностями.

Не только Google пытается заставить путешественников пользоваться своими услугами. Alexa Smart Assistant от Amazon также предлагает ряд голосовых навыков, облегчающих путешествие, например, Virgin Holidays запустила новый «навык» на этой платформе, который может трансформировать голосовой помощник Амазон в личном турагентстве. Это позволяет пользователю выбрать лучший вариант путешествия из более чем 3 миллионов дат, аэропортов и направлений, а затем найти ссылку для бронирования в приложении Alexa. Все это делается посредством телефонных разговоров.

Подобные услуги предлагают и другие магнаты туриндустрии с помощью Алекса. Expedia может предоставить подробную информацию о предстоящих поездках, проверить статус рейса, забронировать автомобиль напрокат, напомнить вам, что взять с собой, и таким образом проверить свои баллы лояльности. В другом сервисе, предлагаемом популярным сервисом Kayak, пользователь может спросить: «Alexa, спроси Kayak, куда я могу полететь за 500 долларов» или «Alexa, попроси Kayak забронировать отель в Берлине». Когда пользователи вводят подробную информацию, такую ​​как даты поездки, навык генерирует варианты и диапазоны цен.

Для тех, кто хочет избавить себя от ожидания в аэропортах, есть навык, позволяющий получить информацию о возможном времени ожидания на контрольно-пропускных пунктах в более чем 450 аэропортах по всей территории США. Вы также можете попросить голосового помощника Amazon перевести короткие предложения с английского на 36 языков. Alexa прочитает перевод, чтобы пользователи могли научиться его произносить. Конечно, вы также можете сообщить об этом иностранному лицу.

В 2016 году отель Wynn Las Vegas объявил, что останется в каждом гостиничном номере Лас-Вегаса. Установлено устройство Amazon Echo. В октябре 2017 года Marriott объявила о планах оборудовать 100 6 гостиничных номеров в Китае умной колонкой Alibaba Tmall Genie. Сеть также является сервисным партнером (XNUMX). Благодаря этому постояльцы отеля могут с помощью ассистента управлять освещением номера, проигрывать аудиоконтент, узнавать прогноз погоды, заказывать обслуживание в номере, звонить на ресепшн и даже выписываться голосом.

6. Alexa для гостеприимства

Гиганты и их платформы

Недавнее исследование Gartner показывает, что рынок ИИ, чат-ботов и виртуальных помощников составляет примерно XNUMX поставщиков по всему миру. Конечно, они используют собственные решения, но чаще тянутся к платформам, предлагаемым крупнейшими игроками, такими как Dialogflow Google, IBM Watson Assistant, SAP Conversational AI, TARS, Oracle Digital Assistant, Verloop, Amazon Lex, Kore. ай, SentiOne, Чатфуэль.

Одной из старейших компаний в этой отрасли является Nuance, основанная в 1992 году. Она занималась голосовой аутентификацией и программным обеспечением. Чат-бот, разработанный Ниной в последние годы, гордится своими клиентами из списка Fortune 500, такими как Coca-Cola и ING.

Другим историческим примером является компания Next IT, основанная в 2002 году, которая является старейшим поставщиком решений исключительно для чат-ботов. Более известна, хотя и намного моложе, компания Kore.ai, готовящая ботов для компаний под заказ. Другие продукты, известные на мировом рынке, включают InbentaBot, способный поддерживать более 25 языков, Персонализация, которая, по заверениям создателей, на финансовом рынке может откликнуться на 95 процентов. запросы клиентов, Nano Rep, которая утверждает, что ее чат-бот снижает нагрузку на агентов до 70%, MindMeld, приобретенная Cisco в марте 2017 года, и Claire.AI, которая специализируется на финансовых услугах в Юго-Восточной Азии, обслуживая m .in. языки — индонезийский, китайский (упрощенный и кантонский), японский, корейский, малайский, тагальский, тайский и вьетнамский.

Технологические гигантытакие компании, как Google, IBM, Microsoft, Amazon и Facebook, инвестируют в диалоговые платформы искусственного интеллекта, чтобы разработчики могли легко создавать чат-ботов. Одним из самых популярных является приложение Google Dialogflow (7). В настоящее время он является эталоном для сравнения с конкурентами.

Dialogflow, ранее api.ai, — это платформа для разработки чат-ботов, купленная Google в 2016 году. Его имя было изменено на Dialogflow. Википедия описывает Dialogflow как «мастер методов взаимодействия человека с компьютером, основанный на разговорах на естественном языке».

Dialogflow это платформа, которую можно использовать для разработки диалоговых взаимодействий ИИ в чат-ботах, голосовых и виртуальных помощниках, которые интегрированы с различными коммуникационными платформами, прежде всего в Google Assistant, но также и в других приложениях, включая Facebook Messenger, Slack, Twitter, Kiku, Line , Skype, Telegram, Twilio или Viberze.

Как работает Google Dialogflow? Пользователь отправляет ввод в приложение через устройство. Этот ввод может быть текстовым или голосовым сообщением. Это сообщение отправляется в Dialogflow. Входящее сообщение классифицируется Dialogflow и сопоставляется с намерениями, определенными разработчиком чат-бота. Разработчик чат-бота может использовать обучающие фразы, чтобы научить систему определять намерения. По указанному выше принципу webhook отправляются запросы о том, какие действия следует предпринять на сайте или в приложении по заданному запросу. Ответы бота могут быть написаны непосредственно разработчиком или могут быть выбраны через Dialogflow. Диалоговая система может работать извне и разрабатываться с помощью веб-перехватчиков и внешних API. Ответ организуется и форматируется в соответствии с требованиями приложения диалога.

Другие платформы разработки чат-ботов с искусственным интеллектом, похожие на Dialogflow, включают: Amazon Lex, IBM Watson Assistant, Wit.ai Facebook (8) и сервис Microsoft Azure Bot. Преимуществом Dialogflow является возможность широкой интеграции с различными платформами. Однако стоит помнить, что другие платформы чат-ботов также работают с несколькими платформами. Например, IBM Watson обеспечивает интеграцию с популярным инструментом разработки веб-сайтов WordPress.

8. Презентация Wit.ai на конференции F8 2018.

Фейсбук Wit.ai он не обеспечивает прямой интеграции с приложениями, однако на этой платформе доступны библиотеки для различных языков программирования, таких как Python, JavaScript node. Таким образом, разработчики могут довольно удобно использовать Wit.ai при создании своих диалоговых приложений ИИ. Кроме того, другие платформы бесплатны лишь в ограниченной степени. Также стоит помнить, что Wit.ai предлагает целых пятьдесят языковых вариантов. Dialogflow поддерживает более двадцати языков. В бета-версии IBM Watson поддерживает более десяти языков. Amazon Lex поддерживает только английский язык.

Любой, кто имел дело с диалоговыми интерфейсами, чат-ботами и голосовыми помощниками, наверное, согласится, что текущий уровень развития этой техники можно сравнить с поисковыми системами в Интернете до появления поисковой системы Google. Пожилые интернет-пользователи помнят, как неудовлетворительно было тогда при поиске чего-либо в Интернете. Итак, мы знаем, чего хотим, когда дело доходит до общения с машинами, мы знаем, какие проблемы с этим существуют на данный момент (9), и мы ждем решения, которое решит их, как это сделал алгоритм Google много лет назад с поиском в Интернете.

Добавить комментарий