Schema-Guided Dialogue (SGD)
Набор диалогов для обучения голосовых помощников

Продукт
Разработчики: Google
Дата премьеры системы: октябрь 2019 г
Отрасли: Интернет-сервисы
Технологии: Речевые технологии

Содержание

2019: Анонс

В конце октября 2019 года стало известно о том, что Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Проект американской корпорации получил название Schema-Guided Dialogue (SGD).

«
Современные виртуальные помощники помогают пользователям выполнять широкий спектр задач, включая поиск рейсов, поиск ближайших мероприятий и фильмов, резервирование чего-либо, поиск информации в интернете и др., — говорят инженер-программист Абхинав Растоги (Abhinav Rastogi) и технический руководитель отдела Google Research Пранав Хайтан (Pranav Khaitan). Несмотря на огромный прогресс, проблемы адаптивности часто упускаются из виду в современных моделях. Частично это связано с отсутствием подходящих наборов данных, которые соответствуют масштабу и сложности, с которыми сталкиваются такие виртуальные помощники.
»

Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Новый проект американской корпорации получил название Schema-Guided Dialogue (SGD)

В базу SGD входит 18 тыс. проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом. Диалоги могут разбиты по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Для большинства тем предусмотрено несколько разных API, многие из которых имеют пересекающиеся функции, но разные интерфейсы, отражающие типичные сценарии реального мира.

По словам создателей SGD, это первый набор данный, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Разработчики также заявляют, что унифицированная модель, которая лежит в основе открытой модели Google для отслеживания состояния диалогов, облегчает представление общих знаний между похожими концепциями в разных сервисах. Это позволяет разработчикам обращаться к новым сервисам, которые ранее не обучались на основе данных из SGD.[1]

Смотрите также Голосовые помощники (бормотографы)



Примечания



СМ. ТАКЖЕ (69)


Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (28)
  SteadyControl (19)
  Naumen (Наумен консалтинг) (15)
  Другие (214)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Naumen (Наумен консалтинг) (3)
  SteadyControl (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Robovoice (Робовойс) (3)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  Другие (38)

  Voice Systems Robotics (VSR, VS Robotics) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Наносемантика (Nanosemantics Lab) (1)
  Проф ИТ (Prof IT) Ростов-на-Дону (1)
  Сбербанк (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 31)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 30)
  SteadyControl (1, 24)
  SteadyControl HoReCa (1, 24)
  Другие (409, 235)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (28, 45)

  Voice Systems Robotics (VSR, VS Robotics) (1, 2)
  SteadyControl HoReCa (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  СалютДевайсы (ранее SberDevices) (1, 1)
  Другие (7, 7)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2022 год
2023 год
2024 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 24
  BSS Digital2Speech - 21
  Voice2Med Система распознавания речи в медицине - 14
  EXpress Защищенный корпоративный мессенджер - 13
  Другие 225

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  SteadyControl Система контроля и управления персоналом - 3
  Другие 14

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 6
  SmartLogger II - 4
  Другие 23

  SteadyControl Система контроля и управления персоналом - 5
  EXpress Защищенный корпоративный мессенджер - 5
  BSS Digital2Speech - 4
  Napoleon IT отзывы - 3
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3
  Другие 36

  VS Robotics: VS Робот-оператор - 2
  ЦРТ: Voice2X Платформа голосового ввода для крупного бизнеса - 1
  Сбер: GigaChat - 1
  МТС Exolve: Сервис речевой аналитики на базе нейросетей - 1
  BSS: Речевая аналитика - 1
  Другие 5