Amazon Textract

Продукт
Название базовой системы (платформы): Amazon Web Services (AWS)
Разработчики: Amazon
Дата премьеры системы: май 2019 г
Технологии: SaaS - Программное обеспечение как услуга,  СЭД - Системы потокового распознавания

2019: Анонс

В конце мая 2019 года Amazon запустила облачный сервис для распознавания документов Textract, который способен автоматически извлекать из страниц текст, таблицы и другие данные. Поддерживаются различные форматы, включая JPEG, PNG и PDF.

Textract относится к программам оптического распознавания текста (OCR), как и, например, Abbyy FineReader. В отличие от многих OCR-решений Textract не просто извлекает текст из документов, но и распознаёт их формат и содержание. Например, он различает таблицы и формы в документах, в том числе в чеках, налоговых декларациях и товарных накладных, а также поддерживает графические форматы. После распознавания ПО самостоятельно структурирует данные.

Amazon выпустила конкурента Abbyy FineReader

В Amazon утверждают, что сервис Textract способен определить паспортные данные, даты рождения и адреса, после чего правильно интерпретировать вне зависимости от того, в каком месте страницы они находятся. В случае изменения шаблона система не пропустит неправильный результат.

По словам разработчиков, добиться высокой эффективности распознавания удалось за счёт использования машинного обучения (МО) для обработки миллионов документов. В результате система научилась правильно идентифицировать текст и объекты «практически в любом» типе документов.В «Т1» — большое укрупнение. TAdviser составил карту активов холдинга 12.8 т

Разработчикам для подключения Textract к своим приложениям не нужно быть специалистами по машинному обучению, говорит вице-президент отдела Amazon Machine Learning Свами Сивасубраманян (Swami Sivasubramanian). Они могут извлекать текст и данные, используя СУБД и аналитические сервисы Amazon и наладить интеграцию с другими МО-сервисами.

Textract предназначен для автоматического распознавания большого количества документов. Стоимость пользования сервисом начинается с $1,5 за 1000 обработанных страниц.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Elma (Элма) (1796)
  ВидеоМост (VideoMost) (1767)
  TrueConf (Труконф) (1599)
  Террасофт (Terrasoft, ТС-Консалтинг) (1147)
  Directum (Директум) (813)
  Другие (9336)

  Elma (Элма) (179)
  Directum (Директум) (84)
  Первый Бит (27)
  1С-Рарус (23)
  Адванта Консалтинг (Advanta) (22)
  Другие (436)

  Directum (Директум) (231)
  Elma (Элма) (141)
  Адванта Консалтинг (Advanta) (24)
  Первый Бит (19)
  СКБ Контур (15)
  Другие (318)

  Directum (Директум) (92)
  1С-Рарус (24)
  Elma (Элма) (23)
  МТС Линк (Вебинар, Вебинар Технологии) ранее Webinar Group (21)
  Первый Бит (17)
  Другие (376)

  1С-Рарус (3)
  МТС Линк (Вебинар, Вебинар Технологии) ранее Webinar Group (2)
  Okdesk (Облачные Решения) (1)
  OptiTeam Consulting, Оптитим Консалтинг (ранее MCB Consulting, ЭмСиБи Консалтинг) (1)
  АТОМС Консалтинг (ATOMS Consulting) (1)
  Другие (7)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  1С Акционерное общество (35, 2945)
  Elma (Элма) (4, 1929)
  ВидеоМост (VideoMost) (3, 1818)
  TrueConf (Труконф) (3, 1615)
  Directum (Директум) (4, 1292)
  Другие (2015, 8171)

  Elma (Элма) (2, 179)
  Directum (Директум) (1, 145)
  1С Акционерное общество (11, 96)
  Naumen (Наумен консалтинг) (6, 30)
  1С-Битрикс (1, 26)
  Другие (89, 309)

  Directum (Директум) (1, 242)
  Elma (Элма) (1, 146)
  1С Акционерное общество (8, 74)
  1С-Битрикс (1, 33)
  Адванта Консалтинг (Advanta) (1, 24)
  Другие (80, 236)

  Directum (Директум) (2, 181)
  1С Акционерное общество (10, 75)
  Elma (Элма) (2, 32)
  Naumen (Наумен консалтинг) (7, 22)
  МТС Линк (Вебинар, Вебинар Технологии) ранее Webinar Group (1, 22)
  Другие (91, 234)

  1С Акционерное общество (2, 5)
  Optimacros (Оптимакрос) (1, 2)
  Directum (Директум) (1, 1)
  МойОфис (ООО Новые облачные технологии) (1, 1)
  1С-Битрикс (1, 1)
  Другие (3, 3)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ВидеоМост (VideoMost) ВКС - 1817
  TrueConf Server - 1599
  ELMA BPM Suite - 1430
  Directum RX - 1285
  1С:ERP Управление предприятием 2 - 1019
  Другие 9128

  ELMA365 - 160
  Directum RX - 145
  1С:ERP Управление предприятием 2 - 61
  1С-Битрикс24 - 26
  ELMA BPM Suite - 22
  Другие 322

  Directum RX - 242
  ELMA365 - 146
  1С:ERP Управление предприятием 2 - 56
  1С-Битрикс24 - 33
  Advanta (Адванта) - система управления проектами - 24
  Другие 232

  Directum RX - 180
  1С:ERP Управление предприятием 2 - 50
  ELMA365 - 25
  МТС Линк Платформа для бизнес-коммуникаций и совместной работы - 22
  1С-Битрикс24 - 16
  Другие 249

  1С:ERP Управление предприятием 2 - 4
  Optimacros Платформа для оптимизационного и консолидационного планирования - 2
  1С:Предприятие 8 через интернет (1С:Fresh, 1С:Фреш) - 1
  1С-Битрикс24 - 1
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 1
  Другие 4

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (251)
  Smart Engines (Смарт Энджинс) (136)
  Directum (Директум) (133)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (752)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (15)
  ЭЛАР (Электронный архив, НПО Опыт) (8)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Konica Minolta Business Solutions Russia (Коника Минолта Бизнес Сольюшнз Раша) (1)
  Другие (7)

  ЭЛАР (Электронный архив, НПО Опыт) (16)
  Smart Engines (Смарт Энджинс) (15)
  Directum (Директум) (2)
  ITFB Group (АйТиЭфБи Групп) (2)
  Почта России (1)
  Другие (2)

  Smart Engines (Смарт Энджинс) (2)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 252)
  Directum (Директум) (6, 162)
  Smart Engines (Смарт Энджинс) (20, 144)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (177, 627)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 8)
  Digital Design (Диджитал Дизайн) (2, 2)
  Content AI (Контент ИИ) (1, 2)
  Beorg (Биорг) (1, 2)
  Другие (5, 5)

  ЭЛАР (Электронный архив, НПО Опыт) (4, 16)
  Smart Engines (Смарт Энджинс) (3, 15)
  Directum (Директум) (2, 2)
  ITFB Group (АйТиЭфБи Групп) (1, 2)
  Digital Design (Диджитал Дизайн) (1, 1)
  Другие (2, 2)

  Smart Engines (Смарт Энджинс) (2, 2)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ЭЛАР ПланСкан - 155
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 125
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 791

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Beorg Smart Vision - 4
  ЭЛАР СканИмидж - 4
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 4
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Beorg Smart Vision - 2
  ContentReader Server - 2
  Другие 11

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 10
  ЭЛАР СканИмидж - 4
  ITFB EasyDoc - 2
  Directum Jazz - 2
  Другие 10

  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 1
  Smart ID Engine (ранее Smart IDReader) - 1
  Другие 0