Compressimo

Продукт
Разработчики: Cognitive Technologies (Когнитивные технологии)
Дата последнего релиза: сентябрь 2012 года
Технологии: СЭД - Системы потокового распознавания

Российская компания Cognitive Technologies вывела летом 2012 года на российский и зарубежные рынки программу Compressimo, предназначенную для сканирования и сжатия документов и пересылки их по почте.

Разработчикам продукта удалось решить важнейшую для электронного документооборота задачу – обеспечить высокую степень сжатия оцифрованных документов при сохранении высокого качества архивной копии. По словам руководителя департамента массового ввода документов Владимира Арлазарова, стандартные алгоритмы сжатия оцифрованных изображений мало применимы для этой цели – они могут обеспечить высокое качество документа только при его сохранении в виде довольно объемного файла.

Компания Cognitive Technologies разработала собственные алгоритмы обработки сканированных документов. В прошлом году была представлена технология компрессии Cognitive PDF/A, которая решает задачу компактного сохранения изображений за счет структурного анализа как в пространстве объектов документа (текст, картинки, подписи), так и в цветовом пространстве (цветные, битональные тексты). На основе гистограмм цветовой насыщенности изображения разделяются на зоны, содержащие текст, и зоны с нетекстовыми объектами. Кроме того, принимается в расчет, что в цветовом пространстве черно-белый текст находится в определенной зоне, а все цветные объекты – в других зонах. Благодаря этому в документе выделяются текстовый слой и слой с печатями, подписями и т. п., в каждом из них могут быть установлены свои показатели контрастности и насыщенности, при этом битональный текст можно подвергнуть значительному сжатию, обеспечивая в то же время его хорошую читаемость, а слой с печатями и подписями сжать в меньшей степени.

После сборки всех слоев удается значительно уменьшить объемы итоговых файлов по сравнению с тем, что дают традиционные методы. Например, обычная товарная накладная формата А4 с печатями и подписями после сканирования с разрешением 300 точек на дюйм и сохранения в формате JPG со сжатием 90% занимает около 1 Мбайт, тогда как Compressimo упаковывает ее в файл формата PDF/A объемом 90–100 Кбайт, а иногда и того меньше. На долю такого рода документов (накладные, деловые письма, счета, договоры, расписки, таблицы) приходится обычно 90% документооборота российских компаний.Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft 2 т

При обработке документов программой Compressimo нередко удается получить текстовый слой лучшего качества, чем в исходном документе. Программа обеспечивает распознавание текста на 23 языках с помощью встроенного в нее и доработанного ядра OCR-системы CuneiForm (Cognitive OpenOCR). Исходные коды последней компания открыла еще в 2008 году, и с тех пор с помощью присоединившихся к проекту новых участников она была значительно усовершенствована. Распознанный текст сохраняется вместе с изображением документа, что обеспечивает возможность полнотекстового поиска и копирования текста. Стоит отметить, что другие методы сжатия изображений не обеспечивают такой возможности. Кроме того, результирующие документы, создаваемые программой Compressimo в формате PDF/A, полностью соответствуют требованиям стандарта ISO 19005-1:2005.

По словам директора по международным продажам Антона Назаркина, с момента вывода Compressimo на российский рынок в июне 2012 года продано уже более 3500 лицензий. При этом программа рассчитана на широкий круг пользователей, не требует предварительных настроек и настолько проста, что любой клерк может освоить ее за несколько минут. Малый размер обработанных файлов позволяет иметь большой архив электронных документов в оперативном доступе, и предприятия с удовольствием отказываются от бумажных документов: сразу сканируют их и сдают в архив, откуда извлекают только в особых случаях, например по требованию суда и т. п. Cognitive Technologies рассчитывает через три года завоевать 7–10% мирового рынка систем сканирования и сжатия документов, объем которого эксперты прогнозируют на уровне $20 млрд.

30-дневную полнофункциональную демоверсию программы можно скачать с сайта www.compressimo.ru. Мы воспользовались этой возможностью и проверили: файл товарной накладной с печатями и подписями, сохраненный после сканирования с разрешением 300 точек на дюйм в формате JPG со сжатием 90%, занял 1,24 Мбайт; тот же документ, сохраненный программой Compressimo в формате PDF/A, – 93 Кбайт.

Стоимость лицензии Compressimo на одно рабочее место составляет в России 799 рублей, на зарубежном рынке – 20 евро.Просмотров: 247

Источник: IT News №14 (сентябрь 2012)



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (745)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Синтеллект (Syntellect) (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (16, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 621)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Content AI (Контент ИИ) (1, 2)
  Beorg (Биорг) (1, 2)
  Другие (4, 4)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 113
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 776

  Syntellect Tessa Мобильное согласование - 30
  Syntellect Tessa Графический визуализатор процессов - 28
  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 6
  ABBYY FlexiCapture - 6
  Другие 28

  Smart ID Engine (ранее Smart IDReader) - 10
  ЭЛАР ПланСкан - 9
  Beorg Smart Vision - 8
  ЭЛАР ПауэрСкан - 2
  Directum Jazz - 2
  Другие 16

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Syntellect Tessa Графический визуализатор процессов - 4
  Beorg Smart Vision - 4
  ЭЛАР СканИмидж - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 5
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Beorg Smart Vision - 2
  ЭЛАР СканИмидж - 2
  Другие 10