Автоматическое распознавание сканов документов и не только. История одной жизни...

Публикация № 1103532

Сообщество - О жизни

32
В нашу жизнь все чаще и чаще внедряется искусственный интеллект, автоматизируются многие задачи, которые буквально 10 лет назад казались не реализуемыми в принципе. Сейчас все более актуальными становятся задачи автоматизации операторской работы, которые вытесняют человека или помогают ему упростить работу. Вот и мне захотелось поделится примерами такой автоматизации. За последние 4 года мне довелось более 10 раз внедрять подсистемы распознавания. Т. е. примерно каждые 4 месяца сталкиваюсь с задачами автоматизации распознавания и прикрепления сканов документов и похоже количество таких задач будет только возрастать. Хочу поделиться историями таких автоматизаций.

Далее я все цифры буду приводить в часах, т. к. в ценах не интересно, потому что они отличаются по годам и по регионам.

Первый клиент, который запомнится на всю жизнь)))

Итак, в конце 2014 года к нам обратился немаленький клиент с интересной задачей: автоматизировать прикрепление сканов документов к документам в базе УПП. Задача казалась очень интересной и передовой, ведь по опросу никто с таким раньше не сталкивался.

Также заказчик стал просто зарываться в бумажках, оригиналы постоянно где-то терялись, количество запросов от налоговой по встречным проверкам возрастало, приходилось предоставлять сканы оригиналов, а их надо было долго искать в архиве, сканировать, отправлять налоговую. Работницы архива даже иногда чай попить не могли 😊. В общем задача была продиктована самой жизнью.

Предложили для начала сделать обследование, в результате выяснилось:

Исходящие документы (реализации и счета-фактуры)

•    Среднее количество пакетов документов в год   -  227000 шт.

•    Среднее количество листов в пакете документов  -  3 листа.

Входящие документы (Поступления товаров и услуг, доп. Расходы)

• Среднее количество пакетов документов в год -  68000 шт.

• Среднее количество листов в пакете документов  -  3 листа.

Т. е. получалось, что пользователи вводят порядка 808 документов вдень в каждом по три листа и получается около 2424 листов в день, которые надо будет распознать (была идея поставлять им бумагу 😉).

Причем нагрузка в месяце распределялась неравномерно, естественно все откладывали подписание и возврат документов на конец текущего, начало следующего месяца.

На тот момент распознавание было только в документообороте, поэтому клиенту был навязан предложен документооборот как файловое хранилище с последующей возможностью перенести некоторые процессы предприятия в него. Кажется, тогда это был еще документооборот 1.4

У него уже появилась бесшовная интеграция и уже пару раз довелось ее внедрить у других клиентов, так что проблем с отображением прикрепленных сканов в УПП не было, обо всех подводных камнях было известно.

Единственный минус – ДО распознавал только EAN13, а у клиента печатались ШК в Code128. Поэтому предложили создать свою подсистему генерации и печати уникального ШК.

Долго думали над проблемой генерации уникального номера при параллельной работе, а на тот момент одновременно вводить и печатать могли порядка 50-70 сотрудников. В лучших традициях исторического жанра решение приснилось (да-да именно приснилось, вот что значит интересная задача) и оказалось простым: для генерации уникального ШК был создан новый справочник с числовым номером. Как показала практика – ни одной проблемы с неправильной генерацией за время эксплуатации и сопровождения не было. Я потом эту идею не раз применял на практике для других задач.

ШК представлял из себя ПППНННННННННК, где

ППП – префикс,

ННННННННН – уникальный номер, сгенерированный справочником,

К – контрольный символ

По расчетам должно было хватить номеров лет на 200, что вполне устраивало заказчика.

Получилась красивая и легко настраиваемая подсистема: в регистре сведений для любого типа документов/справочников можно было задать префикс из 3 символов и необходимость печатать на его печатных формах штрихкод.

Далее была проблема с тем, где печатать это ШК и как его печатать. Рассмотрели все возможные варианты, которые были доступны на тот момент и выбрали печать с использованием шрифта EanGnivc.

Далее сделали авто установку этого шрифта при запуске базы и предупреждение, если не удалось установить.

Решено было помещать его в колонтитул, если занят нижний, то в верхний.

Настройка УПП обошлась малой кровью: добавили настройки всего в двух местах и она стала работать для всех документов в УПП.

Далее ШК генрился при записи документа, если для него было включено использование ШК и настроен префикс. Либо при первой печати, если до этого не был сгенерирован ШК, например, для старых документов или документов, настройка печати для которой была включена позднее.

Для внешних печатных форм пришлось прописать печать ШК в их коде, добавив одну строку кода.

Потом выяснилось, что в некоторых печатных формах оба колонтитула заняты, поэтому доработали функцию вывода, которая проверяла занятость колонтитулов и вставилась небольшая область с ШК в начале документа. Ну и пришлось сделать проверку, если документ теперь не помещается на лист на принтере – уменьшить масштаб в цикле на 1 процент, пока не станет помещаться. С колонтитулом проблем не было – он печатался на каждой странице, а с областью пришлось повозится, чтоб также выводить на каждую страницу.

На эту подсистему было потрачено порядка 50 часов.

Далее была настроено бесшовная интеграция с ДО и обмен НСИ с ДО.

Также была проблема с тем, что при сканировании в ДО уже должна быть информация о документе и его ШК, поэтому доработали выгрузку всех новых/изменённых документов из УПП в ДО по правилам интеграции с ДО.

Решили не выгружать старые, только при необходимости, а такая необходимость могла возникнуть при изменении и при регистрации ШК для этого документа, т. е. просто настроили правило: регистрировать к выгрузке все, что изменено или для чего зарегистрирован новый ШК

На настройку интеграции и обмена ушло порядка 90 часов.

Далее начиналось самое интересное

Клиент купил для начала 2 или 3 мощных потоковых сканера с заоблачной производительностью, конкретные цифры не помню. Проблема со скрепками решалась до сканирования, бухгалтера их сами открепляли.

И вот уже был архив с несколькими тысячами сканов исходящих документов для тестов. Попробовали типовую обработку распознавания – справилась с 30%, стали разбираться.

Оказалось качество сканирования не очень, поигрались с настройками сканера, процент распознавания увеличился до 50%.

Стали разбираться дальше, оказалось, что документы в сканер клали произвольным образом и ШК мог быть внизу, вверху, слева или справа, а компонента с этим не очень справлялась. А если еще ШК был под углом, то вообще атас.

Пришлось пожертвовать производительность и, если не распознался ШК – обрезать 50 мм с каждого края, увеличивать немного картинку и на каждом кусочке пытаться распознать ШК с помощью компоненты. Процент распознавания увеличился до 95%, скорость распознавания упала процентов на 30%, но это было не критично, сервер справлялся с нагрузкой с запасом. Даже сканы под небольшим углом тоже начинались нормально распознаваться.

Потом выяснили что криво распознаются ШК, которые начинались с 0, пришлось префикс в регистре задавать с 100, а не 001, но это проблем не вызвало

Стали разбираться с оставшимися - оказалось, что большая часть просто без ШК, пользователи в потоковый сканер клали все подряд: служебные записки, другие документы, на которых не печатался ШК, пусты листы (да и таких было не мало, наверное, хотели сломать систему 😊). Как решили эту проблему – чуть дальше.

Для входящих документов решили клеить ШК на них с помощью этикеток. Купили принтеры этикеток, в документах сделали внешнюю форму для печати этикетки заданного размера и бухгалтера пошли штамповать их на входящие.

Пробовали распознать входящие документы - результат удивил, распозналось около 2-3%.

Стали разбираться – оказалось, что глянцевые этикетки засвечивались при сканировании и линии искажались. Такие сканы с ШК просто ничем не читались. Поменяли этикетки на матовые, бухгалтера переклеили все этикетки, матерясь на программистов. После этого процент распознавания также увеличился до 93-95%. Проблема с оставшимися была в основном такой же: попадались не те документы. Документы с ШК не распознавались в итоге не более 0,5-1% из общей массы, что соответствовало требования заказчика.

Распознавание было сделано часов за 30.

Далее началась опытно промышленная эксплуатация и новые задачи по оптимизации.

Первое с чем столкнулись – новые документы не успевали выгрузится в ДО, причем задание работало 24 часа в сутки.

Стали разбираться, оказалось, что у них часто запускается групповое перепроведение и в итоге много документов повторно регистрируется к выгрузке.

Оптимизировали несколькими способами:

  1. Перепроведение запускалось обычно под определённом юзером или кто-нибудь из местных программистов его делал, поэтому в юзере добавили настройку, которая исключала регистрацию под ним, этого оказалось достаточно, но решили не останавливаться 😊
  2. В регистре сведений, где задавались префиксы – сделали доп. Поле «Приоритет выгрузки», т. е. можно было регулировать какие документы выгружать первыми, а какие могут и подождать
  3. Поменяли программный приоритет выгрузки, ранее выгружались в хронологическом порядке, переделали, чтоб сначала выгружались те, которых еще нет в ДО, а потом все изменения существующих документов

Этого оказалось достаточно.

 

Далее возникла проблема с не распознанными, они стали накапливаться

Т.е. все сканы сливались в одну общую папку, ДО анализировал каждый файл этот папки и если распознавал – прикреплял в ДО и удалял файл из папки, если не распознавал, то перемещал его в подпапку «Нераспознанные» и потом после основной работы еще раз анализировал подпапку Нераспознанные, на случай если документ пришел в ДО позже первого сканирования

Решили не выделять для распознавания таких файлов отдельного человека, а переложить это на юзеров, которые сканируют. Т.е. сканы разделил по папкам, каждый юзер сканировал в свою папку, а ДО распознавал и перемещал не распознанные в его подпапку, потом юзер должен был войти в ДО, запустить специальную обработку, которая показывает ему все не распознанные его файлы, открывала выделенный в этом же окне и позволяла

  1.  удалить его, если это файл без ШК, например
  2. Найти документ по ШК или реквизитам вручную и прикрепить
  3. Оставить его и разобраться с ним позже

Внешний вид был такой:

Т. е. пользователь работал со сканом из одного окна

В результате пользователи перестали класть в сканер всякую ерунду и стали этикетки на входящие клеить ровно ))), чтоб не увеличивать себе работу.

В результате процент распознавания увеличился практически до 100%, а после разбора не распознанных юзером был равен почти 100% (некоторые по ошибке удаляли нужный файл)

На эту часть ушло около 70 часов.

Завершающей частью было повторное сканирование в архиве, чтобы был зафиксирован факт того, что оригинал документа лежит в архиве. Это нужно было для того, чтобы отследить ситуацию, когда документ терялся в процессе передачи бухгалтером в архив.

Отличие от первого сканирования было только в том, что программное сравнивалось количество отсканированных листов и проставлялся признак в ДО наличия оригинала документа.

Потом на совещании с главным бухгалтером черт меня дернул сказать, что в УПП можно отображать признак наличия документа. Ей идея так понравилась, что пришлось резать другие мелкие задачи, чтобы это сделать, т. к. стоимость была жестко зафиксирована в ТЗ.

Но зато получилось красиво и наглядно. Была добавлена колонка, в виде скрепки, которая отображала текущее состояние документа:

  1. Нет в ДО
  2. Есть в ДО, но без файлов
  3. Если в ДО с сканами, но без оригинала
  4. Если в ДО с сканами и оригиналами, т. е. документ в архиве

 

На эту часть было потрачено около 15 часов

Далее уже без нас заказчик стал расширять перечень сканируемых документов, благо для этого было достаточно включить печать ШК на документе и настроить правила интеграции с ДО в режиме предприятия. Далее система уже работала сама.

Через год где-то возникла проблема с местом, оказалось, что архив стал расти более чем на 3 Тб в год (на сканировали 😊). Но это быстро решили, докупив диски.

После прочтения статьи могло сложиться впечатление, что все делалось на абум и задачи решались по мере поступления, на самом деле это не так, в описании я переплел прошлое и будущее, чтобы выстроить порядок изложения.
Было обследование, составлении и долгое обсуждение ТЗ, сроков, стоимости, архитектуры решения. Вся работа системы была придумана заранее и прописана, от нее практически не отступали в процессе решения задачи. Пришлось загнать себя в жесткие временные рамки, чтобы не потерять заказчика и интересную задачу, но я не жалею, что взял этот риск на себя, ведь в результате времени вполне хватило даже на премии, а полученного опыта и знаний для легкого решения других подобных задач.

В результате заказчик получил

  1. систему, с помощью которой мог сканировать и автоматически прикреплять сканы, а потом и просматривать их базе, не обращаясь в бумажный архив.
  2. Процесс ответов на требования налоговой стал быстрее даже не могу сказать во сколько раз. Ранее надо было подать заявку в архив, пару дней или больше подождать пока их найдут и отсканируют и потом отвечать. После внедрения достаточно было зайти в ДО, воспользоваться типовой обработкой поиска файлов, отобрать нужные документы, например, по контрагенту и периоду и одной кнопкой сохранить все сканы.
  3. Процесс контроля наличия оригиналов значительно упростился
  4. Процесс возврата оригинала стал подаваться контролю, если оригинала не было долго, то документы повторно печатались и отправлялись + уже можно было прописывать в договоре процесс и сроки возврата и при желании накладывать штрафы, ну или пугать контрагента 😊
  5. Сократили затраты на содержание архива

Заказчику заранее предлагалось сделать разные ШК для печатных форм, но в целях экономии он отказался, а где-то через год все-таки решился, но это уже было дороже

Пришлось доработать систему, чтобы ШК генерировался для каждой печатной формы.

Вернее не так, в регистре, где задавались настройки печати ШК добавили поле, в котором выбиралась печатная форма и тип этой печатной формы из специального справочника, потому что у заказчика было около 8 различных печатных форм счетов-фактур для разных крупных клиентов, 6 видов ТОРГ12 и т.п., а по сути это все были счета-фактуры и ТОРГ12. Для всех остальных печатался ШК заданный для документа в целом, т. е. с пустым именем печатной формы. Пришлось доработать передачу вида печатной формы в ДО, но зато при сканировании теперь программа понимала, что это за печатная форма и проставляла ей соответствующий признак.

В результате, например, для налоговой можно было быстро отобрать только счета-фактуры и бухгалтера сразу видели, где какая печатная форма и им не приходилось больше просматривать все файлы. Правда количество уникальных ШК сократилось, теперь их хватит лет на 15-20, но заказчика эта устроило.

На эту настройку ушло около 30 часов.

Смотрю на эту статью думаю, что очень дешево заказчик отделался. Хоть я и не показал здесь затраты на обследование, составление ТЗ, другие мелкие настройки, управление проектом, обучение и т. п.

В итоге получилась классная легко переносимая подсистема. Потом мы ее внедрили у себя, хоть и объем документов раз в 10 меньше, но все равно удобно. Ну и еще один раз внедряли ее у других клиентов + отдавал другим программистам тоже внедрять.

Второй заказчик

Одновременно с первым заказчиком довелось переводить на БП 3.0 другого моего любимого клиента.

У них не было такого большого документооборота, да и отдел бухгалтерии у них был раза в 2 больше.

Однако тогда пугала всех новость о том, что ФНС будет сверять декларации НДС. Было мало информации как это будет происходить и какие последствия. Было четкое понимание, что реквизиты на бумаге должны соответствовать реквизитам в базе на 100%, чтобы можно было оправдаться перед налоговой. В месяц у них было около 1000 входящих счетов-факту, т. е. ручная проверка слишком долго, да и опять же не исключает операторские ошибки при проверке.

Я им предложил попробовать сделать сверку реквизитов на скане и в базе, сканы у них уже давно прикреплялись в базе и процесс входящих документов был построен так, что у любого поступления, счета-фактуры полученного  и прочего был его скан.

На тот момент уже внедрил распознавание у первого заказчика и знаний было достаточно. Хотя здесь задача немного отличалась, в первом случае достаточно было распознать ШК на скане, а здесь надо было распознать текст, найти в нем реквизиты и сравнить их с реквизитами в базе.

Сразу не стали делать автораспознавание в фоне, решили сначала попробовать на клиенте.

В итоге родилась обработка, которая выполняла распознавание сканов входящих счетов-фактур и сверяла с реквизитами в базе. Сверялись реквизиты Номер, дата, ИНН, КПП, Сумма, Сумма НДС

Вся работа по сравнению происходила из одного окна:

Отбирались счета-фактуры, запускалось распознавание и анализ текста. Искались и сверялись реквизиты в распознанном тексте. Выводился результат в виде отчета.

И далее пользователь мог визуально сравнить те реквизиты счет-фактуры в базе и в скане

Внешний вид обработки такой:

 

 

Результат распознавания – 50-80% т. е. в этих счета-фактурах все реквизиты соответствуют их можно не проверять, а в остальных можно провеять реквизиты сразу из обработки, сверить со сканом и при необходимости исправить. Успешность сопоставления реквизитов, конечно, очень сильно зависит от качества распознавания текста, которое в свою очередь сильно зависит от качества сканирования, причем увеличение разрешения сканирования наоборот ухудшает распознавание. Оптимальным оказалось 300 dpi и размерами не более 2500*4000, а то при преобразовании из пдф в картинку потом плохо все распознавалось или не распознавалось вообще.

Распознавание текста оказался процессом не быстрым, на один скан уходило 15-30 сек, поэтому пользователи всегда оставляли распознавание на ночь, а утром проверяли реквизиты. Время на проверку думаю сильно сократилось, сравнивать не с чем, потому что до этого еще никто не сверял сканы или оригиналы вручную 😊. Сейчас на проверку остатка не полностью распознанных обычно уходит 2-3 часа.

Обработка до сих пор помогает сверять и находить ошибки в реквизитах, а бухгалтерам позволяет быть спокойными и уверенными что у них все в порядке с документами.

Периодически звонят и просят проконсультировать как она работает, когда меняется бухгалтер, который этим занимается. Хоть в справке к этой обработке все написано подробно со скринами, но кто же ее читает 😊

Внедрял ее же еще у нескольких клиентов.

Время на эту обработку составило 20 часов.

 

Распознавание табличных частей со сканов

Далее у этого же клиента возникла задача распознавания содержимого скана.

Т. е. процесс документооборота был построен так:

Документ поступал секретарям, они регистрировали его в журнале входящих, создавали пустое не проведённое поступление и прикрепляли к нему скан.

Далее бухгалтера по скану заполняли документ.

Для заполнения больших документов требовалось много времени, поэтому решили сделать распознавание и заполнение товаров

Получилась вот такая обработка, которая распознавала товары на скане и заполняла ТЧ.

 

При хорошем качестве сканирования – распознавала все достаточно успешно

Проблема была с номенклатурой – много корявых символов распознавалось, да и это было наименовании поставщика. Номенклатуру в итоге если не нашли – не заполняли, просто потом выбирали в ТЧ.

Большим плюсом было то, что все остальные цифры заполнялись из скана и это облегчало работу

Время на реализацию ушло 15 часов

После этой задачи чуть больше года был РП на одном проекте и не было времени на другие задачи.

 

Распознавание анкет

В 2017 была еще задача распознавания заполненных на бумаге анкет, но там было распознавание в основном с помощью специального софта ABBYY FlexiCapture, и от 1с требовалось корректно распарсить результат.

Как-то плохо помню эту задачу, наверное, ничего интересного там не было.

 

Разбивка и распознавание пдф

Следующая задача пришла уже в конце 2017 года:

У одной компании поставщики услуг предоставляли в многостраничном пдф подписанные платежки, распорядительные письма и документы по убытку.

Один документ – одна страница, в пдф могло быть от 30 до нескольких сотен страниц.

Требовалось разбить эти пдф постранично в новые пдф, содержащую только одну струнцу из этого файла и в названии файла указать номер, дату документа, номер убытка, рег. Номер и сумму.

Естественно, эти реквизиты были на каждой странице в тексте.

В итоге была написана обработка, которая разбивала пдф, распознавала текст и вставляла в наименование реквизиты.

Точного процента распознавания нигде не сохранилось, но помню, что он был близким или равным 100%. А все дело в том, что в пдф не было сканированных страниц и он очень хорошо распознавался.

Затраченное время на обработку 9 часов

 

Распознавание по номеру и дате

Затем в начале 2018 года пришла задача распознавания сканов по номеру и дате, у клиентов была куча сканов документов без ШК и был специально обученный человек (естественно с высшим образованием 😉), которые эти сканы прикреплял к документам.

Так вот он перестал успевать, т. к. объем документов рос, наверное, в арифметической прогрессии.

Встала задача автоматизировать распознавание по номеру и дате, пусть хоть и не 100%, но существенно снизить нагрузку на человека. Ну и требование, чтоб программа по рег. Заданию распознавала сканы из папки, а что не смогла распознавать – обрабатывал человек.

Тут возникли трудности: компонента распознавания была COM, а на сервере проблемы с ее запуском.

Поэтому рег. Задание запускало на сервере клиент, открывало в нем обработку, обработка выполняла распознавание и закрывала сеанс.

Принципы распознавания были те же самые, распознавался текст на скане и потом в тексте искались определенные теги.

По началу распознавалось порядка 30-40%, стали оптимизировать распознавание. Часто встречались ошибки распознавания в виде:

ноль заменялся на О

в годе даты пробел

вместо точки запятая.

Такие ситуации обрабатывались программно и в результате количество распознавания сканов удалось довести до 60-80%

Также в 2018 распознавание по номеру и дате внедрял еще у одного клиента.

Время на разработку и внедрение ушло 22 часа

 

Распознавание по ШК и по номеру и дате

Ну и последняя задача пришла уже в начале 2019 года

Есть УТ, из нее печатаются документы с ШК, ШК типовыми средствами, т. е. в нем закодирован УИД документа в Code128, нужно было распознать документ по ШК, а если не удалось, то по номеру и дате в скане.

Как было сказано в начале – компонента ДО работала только с EAN13 клиент не соглашался переделывать печать ШК, да и настраивать типовую очень не хотелось.

Стал копаться и нашел программу zbar, которая через командную строку просто и быстро могла распознать любые ШК, в том числе и QR

Прилепил ее к обработке распознавание – отлично распознались 100% тестовых документов.

Отключил временно распознавание ШК, доработал распознавание по тексту, т. к. здесь были другие печатные формы. Распозналось 90%.

Ну и требовалось, чтоб распознавалось автоматически, поэтому прикрутил запуск этой обработки через рег. Задание.

Время на эту работу ушло 12 часов

На этом все!

Я уже давно убедился, что нет не решаемых задач, так что дерзайте, не бойтесь браться за что-то новое.

Как говорил Великий поэт:

О сколько нам открытий чудных
Готовят просвещенья дух
И Опыт, сын ошибок трудных,
И Гений, парадоксов друг,
И Случай, бог изобретатель

© Пушкин

 

Вот, например, в 2011-2012 году довелось делать базу поиска описаний и картинок для товаров через поисковики, гугл, яндекс, бинг и другие. Программа разбирала первые 10 страниц поисковика, сканировала каждую страницу, если находила на ней товар, запоминала для парсинга и потом обрабатывала. Там же были задачи по сравнению похожести изображений, оптимизации поиска, парсинга и т. п. База анализировала миллионы страниц и находила большой поток нужных данных. Но это уже другая история. Тогда я очень плотно познакомился с HTML, PHP, Java и немного CSS (а до этого слышал только название) и эти знания меня уже не раз выручали. 😊

 

Для распознавания всегда использовал Ghostscript и ImageMagick для конвертации пдф в картинку и разбивку по страницам

И CuneiForm для распознавания текста.

32

Специальные предложения

Комментарии
Избранное Подписка Сортировка: Древо
1. Vladimir_Konyrev 220 07.08.19 09:54 Сейчас в теме
"+" и "-" одновременно:

"+" за решение действительно сложной задачи и за то, что поделились бесценным опытом. Молодцы.

"-" за то, что изобретали велосипед, ибо то что Вы сделали на 80-90% уже в 2014 году было, возможно еще не опубликовано, но было: https://infostart.ru/public/365186/
В модуле есть и система присвоения ШК, и передача в ДО, и "скрепки" и т.д. и т.п.
2. Vladimir_Konyrev 220 07.08.19 09:58 Сейчас в теме
посчитал часы - 285 на первую историю, если цена часа тогда была примерно 1400 для регионов, то получается Заказчику обошлось в 399 000, а могло бы, как мне кажется, в 2 раза дешевле, а главное - быстрее.
6. Rustig 1192 04.09.19 12:33 Сейчас в теме
(2) в регионах в 2014? в Казани 500-800р/ч, если не ошибаюсь
3. 77dream77 164 07.08.19 11:15 Сейчас в теме
Вы о чем?
Публикация на инфостарте 11.06.15
Письмо от 1с о продукте от 06.05.2015 http://1c.ru/news/info.jsp?id=19913

https://www.google.com/search?q=%D0%98%D0%BD%D1%82%D0%B5%D0%B3%D1%80%D0%B0%D1%86%D0%B8%D1%­8F+%D1%81+1%D0%A1%3A%D0%94%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%­BD%D1%82%D0%BE%D0%BE%D0%B1%D0%BE%D1%80%D0%BE%D1%82&client=fi­refox-b-d&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2014%2Ccd_max%3A­12%2F31%2F2014&tbm=
Ваш первый комментарий о модуле 12.05.2015 в публикации https://infostart.ru/public/296236/

Обследование началось где-то весной 2014, естественно прорабатывались различные варианты, в том числе и сторонние продукты. рассматривался не только ДО
Что-то я не помню, чтоб в это время находил Ваш велосипед, а то бы точно обратил на него внимание
я вижу в этом комментарие только рекламу своего продукта и ничего более
Dach; for_sale; +2 Ответить
7. Rustig 1192 04.09.19 12:37 Сейчас в теме
(0) спасибо за обзор!
только мелкий шрифт напрягал чтение....

(3) что плохого в рекламе хорошего продукта? пусть будут все мнения и все ссылки на разные "велики", "мотики" и "легковушки"...
4. user824944 09.08.19 17:17 Сейчас в теме
Поделюсь и своим опытом. Да, проблема существует. Принять СФ, Товарные накладные и др. стоит не мало трудов. Пригласил специалистов, аналогичных автору. Говорили очень хорошо. Решили продемонстрировать. С хорошего экземпляра ТН получили ~ 95 символов распознавания. Это на лист А4 порядка 4-5 символов распознанных ошибочно. Спрашиваю, а что же дальше делать? Кто будет нести ответственность за неправильно распознанный текст? Компания, поставщик решения? Будет возмещать убытки? Ответ, думаю, был ясен. Посадить сотра, чтобы потом выверял распознанный текст с оригинала, вычитывал бесконечные технические термины, проще и быстрее вручную вбить документ. Плохое это решение (0), Хорошо что сейчас эта проблема решается с помощью организации электронного документооборота. А по поводу статьи, могу сказать одно : "Гора родила мышь"
5. user824944 09.08.19 17:20 Сейчас в теме
8. Rustig 1192 04.09.19 12:44 Сейчас в теме
(4) а кто несет ответственность за то,что сотр (сотрудник) допустит ошибку при вводе нового документа?
так и здесь, при сканировании и распознавании сотрудник несет ответственность за введенный документ.
использую программу Скан-загрузка от фирмы Гендальф.
вообще интересно получилось - начинали со сканирования оригиналов, потом перешли на то, что наш менеджер списывался с менеджером поставщика и просил прислать эксель документа - который формировался также из 1с.
далее наш менеджер через эту же программу Скан-загрузка заводил новый документ, не дожидаясь поступления оригинала. Признак наличия оригинала проставляется отдельно.
9. Rustig 1192 04.09.19 12:50 Сейчас в теме
(0) почему фрилансеры не выставляют за обследование, составление ТЗ, обучение работе с программой?!....
Оставьте свое сообщение

См. также

Медвежьи услуги по требованию 58

Статья no Нет файла Бесплатно (free) О жизни Управление персоналом (HRM)

О, сколько открытий чудных готовит нам профессия программиста 1С.

вчера в 08:10    1874    1c-intelligence    37       

О работе и организации труда инженера - программиста 21

Статья Программист Нет файла Бесплатно (free) О жизни Личная эффективность

"Как настроить бесшовную интеграцию?", "Чем отличается НаСервере от НаСервереБезКонтекста?", "Как рассчитывается себестоимость в УПП?" на эти вопросы ответов вы тут не увидите, НО! мы поговорим о нас - Инженерах - программистах! Сравнение организации труда "во франче" (далее просто франча) и "на серьёзную организацию" (далее просто организация), какие плюсы и минусы работы в структурно разных предприятиях? Где и к когда лучше работать?

25.09.2019    3217    feva    42       

Хороший заказчик - плохой заказчик 33

Статья no Нет файла Россия Бесплатно (free) О жизни

Лайфхак о том, как стать легендарным клиентом.

13.09.2019    3678    dsdred    24       

Видя деньги 51

Статья no Нет файла Бесплатно (free) О жизни

Немножко бизнес-программирования.

09.09.2019    3898    1c-intelligence    90       

Полюби Козла 42

Статья no Нет файла Бесплатно (free) О жизни Блоги

Не пожалеешь

02.09.2019    3368    1c-intelligence    77       

Корпоративный слон 21

Статья no Нет файла Бесплатно (free) О жизни

Про изменения и их цели.

28.08.2019    3048    1c-intelligence    21       

Холократия - отец порядка. Часть 3. Заключительная 15

Статья no Нет файла Бесплатно (free) О жизни

Поиск идеального места работы имеет неожиданное окончание.

21.08.2019    2494    Ликреонский    31       

Холократия - отец порядка. Часть 1 13

Статья no Нет файла Бесплатно (free) О жизни

Идеальное рабочее место, существует ли оно? Поиском ответов на вопросы и решений проблем много лет занимается автор, результат неожиданный.

18.08.2019    2114    Ликреонский    9       

Аки Феникс 62

Статья no Нет файла Бесплатно (free) О жизни Блоги

Про выгорание

17.08.2019    4283    1c-intelligence    21       

Как я буду мир спасать 46

Статья no Нет файла Бесплатно (free) О жизни Блоги

Почему бы и нет?

30.07.2019    4298    1c-intelligence    75       

Блокчейн, выборы и прозрачность, ч. 1 18

Статья no Нет файла Бесплатно (free) О жизни Блокчейн

Как новейшие технологии помогают придумывать новости и выделять бюджет. Первая часть - абстрактно-теоретическая.

24.07.2019    2073    for_sale    20       

Я не настоящий 25

Статья no Нет файла Бесплатно (free) О жизни

А вы?

23.07.2019    3537    1c-intelligence    94       

Корпоративный квест 34

Статья no Нет файла Бесплатно (free) О жизни

Приём на работу ИТ-директоров в условиях легкого помешательства

06.07.2019    3962    1c-intelligence    55       

Поймай меня, если сможешь. Версия Пророка 27

Статья no Нет файла Бесплатно (free) О жизни

Самая интеллигентная версия.

26.06.2019    4164    1c-intelligence    31       

В поисках Зины 18

Статья no Нет файла Бесплатно (free) О жизни

Статья про программистов

18.06.2019    3941    1c-intelligence    19       

Поймай меня, если сможешь. Версия директора 43

Статья no Нет файла Бесплатно (free) О жизни

Надо же всех послушать.

07.06.2019    5814    1c-intelligence    111       

Заметки фрилансера 17

Статья Программист Нет файла Обучение, бизнес-тренинг, курсы Бесплатно (free) О жизни Личная эффективность

Хочу рассказать о своем опыте работы в качестве фрилансера. По задумке это будет несколько статей, в которых я вспомню набитые шишки, успешные практики работы. Будет полезно для начинающих фрилансеров, а также для матерых программистов в крупной компании, которые задумались о жизни за стаканчиком кофе и сигаретой, глядя в окно на беспечных прохожих, или в пробке по дороге домой, где скучают кот и жена...

31.05.2019    4286    Kutuzov    48       

Неидейный бизнес 14

Статья no Нет файла Бесплатно (free) О жизни

Почему надо возиться с предложениями сотрудников?

21.05.2019    3060    1c-intelligence    14       

Поймай меня, если сможешь. Письмо менеджера 13

Статья no Нет файла Бесплатно (free) О жизни

Альтернативная история.

16.05.2019    3989    1c-intelligence    10       

Лед тронулся, господа присяжные заседатели! 23

Статья no Нет файла Бесплатно (free) О жизни Блоги О сообществе

Всем привет. Всего лишь год назад я писал о том, что в отличие от мира не 1С-ной разработки, у нас практически нет мероприятий для специалистов 1С. Не сказать, чтобы по количеству евентов мы приблизились, скажем, к веб-разработчикам, но за прошедший год ситуация все же заметно изменилась в лучшую сторону. Итак, давайте пробежимся по существующим конференциям, которые были бы интересны разработчикам 1С. Внимание! Дальше будет много текста и фоток!

14.05.2019    3877    Tavalik    10       

Поймай меня, если сможешь. Версия менеджера 38

Статья no Нет файла Бесплатно (free) О жизни

Просто попробуем сделать так, чтобы всё было не так просто.

11.05.2019    6105    1c-intelligence    44       

Поймай меня, если сможешь 35

Статья no Нет файла Бесплатно (free) О жизни

Обращение программиста к эффективному менеджеру.

07.05.2019    6919    1c-intelligence    58       

Место проклятое? 18

Статья no Нет файла Бесплатно (free) О жизни

Кто виноват?

07.05.2019    4776    1c-intelligence    26       

Супермен vs Программист 17

Статья no Нет файла Бесплатно (free) О жизни

Столкнём-ка их, наконец, лбами.

23.04.2019    4776    1c-intelligence    8       

Открываем набор на курсы "Сова - эффективный менеджер" 32

Статья no Нет файла Бесплатно (free) О жизни

Многим знаком знаменитый комикс про "Сову эффективного менеджера", но некоторые ошибочно полагают, что сова, героиня этого комикса, не всегда поступает разумно. Для того, чтобы объяснить ее поведение и научить пользователей Инфостарта эффективному управлению, мы открываем онлайн-курс "Стань лучшей Совой".

01.04.2019    5684    MariaTemchina    27       

Читай старьё 29

Статья no Нет файла Бесплатно (free) О жизни

Почему старые книги лучше новых

23.03.2019    5337    1c-intelligence    76       

Корпоративная мышь 17

Статья no Нет файла Бесплатно (free) О жизни

Об управлении качеством

11.03.2019    4980    1c-intelligence    51       

Корпоративная свинья 25

Статья no Нет файла Бесплатно (free) О жизни

Вернемся в прошлое.

04.03.2019    5838    1c-intelligence    24       

Не только автоматизация учета 76

Статья no Нет файла Россия Бесплатно (free) О жизни

Сказ о том, как одинэсники с сишарперами и питонистами играли.

28.02.2019    6067    Scorpion4eg    41       

Корпоративный напалм 31

Статья no Нет файла Бесплатно (free) О жизни

Чем там закончилось, в туалете-то?

25.02.2019    4997    1c-intelligence    33       

Корпоративный туалет 30

Статья no Нет файла Бесплатно (free) О жизни

Очень странная история.

18.02.2019    6540    1c-intelligence    50       

Корпоративные фрукты 32

Статья no Нет файла Бесплатно (free) О жизни

Хм, а почему бы и нет?

11.02.2019    5152    1c-intelligence    35       

Звонок в техподдержку [юмористический очерк] 19

Статья no Нет файла Бесплатно (free) О жизни Блоги

Специалисты техподдержки должны быть не только высококвалифицированными профессионалами в своей области, но также они должны обладать недюжинным запасом терпения и умением психологического маневрирования. Ведь пользователь попадается очень разный и к каждому нужно постараться найти свой подход. Об этом и будет мой небольшой экспериментальный очерк юмористической направленности. А для колорита я, как большой любитель аллегорических образов, заменю программную тематику на свою излюбленную аналогию - автомобильную тему. История не претендует ни на правдивость, ни на реальность, ни на достоверность. Любые совпадения случайны. А мораль... она в том, что нужно быть готовым к любому развороту событий.

06.02.2019    4508    mbreaker    17       

Корпоративная реальность 24

Статья no Нет файла Бесплатно (free) О жизни

Добавим-ка реализма в нашу сказку.

28.01.2019    5218    1c-intelligence    33       

Карьерное исследование учащихся профессиональных образовательных учреждений Санкт-Петербурга 17

Исследование no Нет файла Россия Бесплатно (free) О жизни

Студенты сделали осознанный выбор профессии, и каждый пятый хочет работать с 1С – этот и другие факты мы выяснили в ходе опроса учащихся вузов и колледжей Санкт-Петербурга.

25.01.2019    3528    Kochergov    8       

Тень точки Кельвина 14

Статья no Нет файла Бесплатно (free) О жизни

Оказывается, уже четыре месяца прошло... Точка Кельвина продолжается.

23.01.2019    4374    1c-intelligence    27       

Криптовалюты, а также иные триста девяносто девять сравнительно честных способов отъема денег 50

Статья no Нет файла Бесплатно (free) О жизни

Случайно наткнулся на Инфостарте на новость о том, что в Белоруссии открывается первая в СНГ биржа криптовалют. В комментариях шло обсуждение вопроса о будущем цифровой экономики – и насколько Россия отстала в этом вопросе. По образованию я криптограф-криптоаналитик и, наверное, давно нужно было написать какую-то статью на эту тему с профессиональной точки зрения. Ну вот, хоть и с опозданием, пишу.

22.01.2019    7245    andironenko    163       

Проще, чем кажется. Глава 19 15

Статья no Нет файла Бесплатно (free) О жизни

19-я глава

21.01.2019    5245    1c-intelligence    12       

Исповедь графомана 18

Статья no Нет файла Бесплатно (free) О жизни Личная эффективность

Как, когда и зачем я пишу.

17.01.2019    5747    1c-intelligence    51       

Кодекс читателя 2 25

Статья no Нет файла Бесплатно (free) О жизни Личная эффективность

Дополняем, улучшаем, расширяем.

15.01.2019    5145    1c-intelligence    20       

Проще, чем кажется. Главы 17-18 14

Статья no Нет файла Бесплатно (free) О жизни

Ну, еще чуть-чуть, и догоним

07.01.2019    5094    1c-intelligence    8       

Корпоративное интервью 32

Статья no Нет файла Бесплатно (free) О жизни

Чего только ни придумают...

04.01.2019    6071    1c-intelligence    57       

Новые методики от Андрея, примеры 17

Статья no Нет файла Бесплатно (free) О жизни Блоги

Несколько новых методик от суперэрудированного и очень скромного директора-гениального писателя-изобретателя методик Андрея

29.12.2018    5105    sikomor3    43       

Песни разработчика: Don't Worry Be Happy 30

Статья no Нет файла Бесплатно (free) О жизни Блоги Поздравления

Решили мы отделом разработчиков номер на корпоратив подготовить. Что из этого получилось - читайте ниже.

28.12.2018    4834    Tavalik    9       

Корпоративный корпоратив 26

Статья no Нет файла Бесплатно (free) О жизни

Новый Год же.

27.12.2018    6087    1c-intelligence    45       

Корпоративная графомания 31

Статья no Нет файла Бесплатно (free) О жизни Блоги О сообществе

Как оно там все устроено, у графоманов? Навеяно https://infostart.ru/public/969752/ и комментариями.

26.12.2018    5230    sikomor3    104       

Корпоративная анатомия 42

Статья no Нет файла Бесплатно (free) О жизни

Как оно там все устроено?

24.12.2018    6454    1c-intelligence    48