1. Главная страница » Компьютеры » 1С документооборот распознавание pdf

1С документооборот распознавание pdf

Автор: | 16.12.2019

Содержание

Система документооборота «Корпоративный документооборот» включает в себя механизм распознавания текста из графических файлов. Механизм распознавания текста может использоваться для решения следующих задач:

  • Извлечение текста для организации полнотекстового поиска по файлам системы документооборота
  • Создание новых текстовых (а также html) файлов на основе графических файлов

Для включения возможности распознавать текст в изображениях необходимо включить функциональную опцию «Использовать распознавание» в настройках параметров системы на закладке «Работа с файлами» (подсистема «Администрирование системы»). После включения этой опции станут доступными следующие пункты:

  • Настройка системы распознавания изображений
  • Установить компоненту CuneiForm
  • Сформировать очередь на распознавание изображений

Вид формы настройки системы приведен на рисунке ниже:


нажмите для увеличения изображения

В форме настройки системы распознавания изображений можно указать, какой язык используется в большинстве файлов, а также требуется ли изменять автора файла после его распознавания.

Язык распознавания в дальнейшем можно будет установить для каждого конкретного пользователя системы, а также для каждого файла системы. Поддерживается распознавание следующих языков:

Английский, Немецкий, Французский, Русский, Шведский, Испанский, Итальянский, Русско-Английский, Украинский, Сербский, Хорватский, Польский, Датский, Португальский, Голландский, Чешский, Румынский, Венгерский, Болгарский, Словенский, Латышский, Литовский, Эстонский, Турецкий.

После настройки системы распознавания можно нажать на кнопку «Установить компоненту CuneiForm» для установки COM-компоненты CuneiForm версии 12 («CuneiForm.Puma»). Кроме установки компоненты распознавания необходимо установить и само приложение CuneiForm. Данное приложение является свободно-распространяемым и его можно скачать с официального сайта cuneiform.ru. Прямые ссылки на скачивание можно получить, нажав на ссылку «справка». После скачивания дистрибутива OCR CuneiForm V.12, запустите файл setup.exe и нажмите кнопку «Далее».

После выполнения установки приложения и COM-компоненты система распознавания готова к работе. Если к моменту включения системы распознавания в СЭД «Корпоративный документооборот» уже существуют графические файлы, которые необходимо распознать, то можно поставить их в очередь на распознавание перейдя по ссылке «Сформировать очередь…». В дальнейшем все графические файлы, перемещаемые в СЭД, будут иметь признак необходимости распознавания. Изменить данный признак можно на закладке «Извлеченный текст» формы файла. Пользователь может установить значение «Нужно распознать» или «Не нужно распознавать» для выбранного файла.

Процесс распознавания в СЭД «Корпоративный документооборот» запускается через специальное регламентное задание «Файлы: Распознавание изображений». Регламентное задание доступно в подсистеме «Автоматическая обработка» как показано на рисунке ниже.

В случае работы базы данных СЭД «Корпоративный документооборот» в клиент-сервером режиме «1С», данное регламентное задание будет запускаться автоматически (по настроенному расписанию). В случае работы базы данных документооборота в обычном, файловом режиме «1С», потребуется запуск отдельного сеанса обработки регламентных заданий. Открыть такой сеанс можно нажав на кнопку «Открыть сеанс обработки» как показано на рисунке выше. Можно также выполнить однократный запуск регламентного задания распознавания изображений нажав на кнопку «Выполнить сейчас».

Существует несколько вариантов (стратегий) выполняемых после распознавания графического файла действий системы СЭД «Корпоративный документооборот»:

  • Поместить только в «Извлеченный текст». После распознавания текст будет помещен в специальное хранилище текста файла. Данное хранилище используется для полнотекстового поиска по текстам файлов системы Извлеченный текст можно посмотреть (и при необходимости изменить) на закладке «Извлеченный текст» формы файла.
  • Создать новую html-версию файла. После извлечения текста из графического файла будет создана новая версия файла в формате HTML. Данная версия станет текущей версией, а исходный графический файл сохранится в предыдущей версии данного файла.
  • Создать новую txt-версию файла. В данном варианте после извлечения текста из графического файла будет создана новая версия файла в формате TXT. Данная версия станет текущей версией, а исходный графический файл сохранится в предыдущей версии данного файла.
  • Создать новый html-файл. При выборе данного варианта будет создан новый файл в формате html, при этом владельцем файла будет тот же владелец, что и у исходного файла (например, некий корпоративный документ).
  • Создать новый txt-файл. При выборе данного варианта будет создан новый файл в формате txt, при этом владельцем файла будет тот же владелец, что и у исходного файла. Пример выполнения данного варианта для документа системы приведен на рисунке ниже.
Читайте также:  Gigabyte nvidia geforce gtx 950

В случае, если по какой-либо причине распознать документ не удалось, то файлу будет присвоен статус «Не удалось распознать». Пользователи могут устранить причину (например, установить дистрибутив CuneiForm) и повторно поставить данный файл в очередь на распознание, поменяв статус на «Нужно распознать».

Примечание: Для решения задачи организации полнотекстового поиска по файлам офисных приложений предназначен механизм извлечения текстов из офисных файлов (MS Word, MS Excel, а также файлов OpenOffice). В отличие от распознавания изображений данный механизм извлекает тексты не из графических файлов, а из файлов офисных приложений. Механизм запускается регламентным заданием «Файлы: Извлечение текста (из офисных файлов)».

Андрей Бирюков

Система электронного документооборота 1С:Документооборот КОРП может работать и с бумажными документами – сканировать и распознавать отсканированные документы, переводя файлы PDF в текстовый формат.

Добавление сканов возможно прямо из карточки документа, не открывая дополнительных программ и интерфейсов.

Для работы со сканером из 1С:Документооборот сначала необходимо установить утилиту сканирования и настроить подключенный локальный сканер. Для этого в разделе «Настройка», в пункте «Персональные настройки» открываем меню «Файлы».

В открывшемся окне выбираем команду «Настройка сканирования».

В настройках указываем подключенный сканер для работы, ставим разрешение сканирования и прочие настройки.

При наличии большого количества документов для сканирования лучше использовать подсистему потокового сканирования. Чтобы открыть это рабочее место, нужно в разделе «Документы и файлы» открыть пункт меню «Потоковое сканирование в 1С Документооборот».

В рабочем месте потокового сканирования предусмотрено два варианта работы со сканами – сканирование в pdf непосредственно со сканера, подключенного к компьютеру пользователя, и загрузка из каталога, если сканер сетевой и согласно политике загружает отсканированные документы в сетевой каталог.

Рассмотрим оба варианта работы.

При работе непосредственно со сканером устанавливаем необходимые параметры сканирования, настройку обработки страниц, распознавания штрих-кодов и историю.

Если надо обработать уже отсканированные ранее файлы, открываем соответствующую команду, указываем целевой каталог, нужные параметры и выполняем команду «Загрузить».

Независимо от выбранного способа загрузки изображений в результате обработки мы увидим получившийся результат.

Перейдем в документ и посмотрим, что в результате отсканировала и прикрепила система.

Да, совершенно верно, сканы прикреплены к карточке договора.

Распознавание графических и PDF файлов на сервере

Чтобы настроить распознавание графических и PDF файлов на сервере, необходимо установить несколько специализированных утилит:

  • Установить программы CuneiForm, ImageMagic и Ghostscript;
  • Задать в настройках программы параметры распознавания и указать путь к программе ImageMagic.

Программа CuneiForm нужна для распознавания графических файлов. Установку программы CuneiForm для файлового варианта системы 1С:Документооборот важно делать на компьютере пользователя под тем пользователем, который в дальнейшем будет с ней работать, а в клиент-серверном варианте на сервере 1С:Предприятия – под пользователем, под которым работает сервис 1С:Предприятия.

Программа ImageMagic нужна для преобразования графических файлов в формат pdf и обратно. Программа Ghostscript нужна программе ImageMagic для преобразования файлов. Устанавливаем обе программы на компьютер пользователя.

Распознавание документов в 1С:Документооборот

В разделе «Настройка и администрирование» в меню «Настройка программы» выбираем меню «Работа с файлами».

Здесь устанавливаем флажок «Распознавание изображений с помощью CuneiForm» и настраиваем параметры распознавания.

Указываем язык распознавания и полный путь к ранее установленной программе ImageMagick. В персональных настройках работы с файлами также прописываем полный путь к программе преобразования PDF-файлов ImageMagick.

Здесь же можно указать индивидуальные настройки языка распознавания файлов. Система к работе с файлами готова.

Откроем отсканированный файл.

Теперь распознаем файл с помощью команды контекстного меню «Дополнительно-Распознать».

Чтобы посмотреть результат распознавания, откроем текстовый образ файла.

Теперь этот файл участвует в индексации полнотекстового поиска документов и файлов, и его можно будет найти по вхождению слов. Для пользователей будет доступна основная версия файла в формате PNG.

Преобразование файлов из PDF с помощью программы преобразования PDF файлов ImageMagick

Аналогично предыдущему примеру распознаем файл в формате PDF и посмотрим результат.

Как мы видим, система 1С:Документооборот с помощью свободно распространяемых и совершенно бесплатных утилит может обрабатывать разнообразные форматы сканов документов для их упорядочивания и индексации в полнотекстовом поиске. При этом работа программы с файлами происходит в фоновом режиме, то есть незаметна для пользователей.

Использование функционала штрихкодирования документов, потоковое сканирование и распознавание файлов обеспечит эффективную и удобную работу службы ДОУ на предприятии любого масштаба, позволяя значительно сокращать издержки времени и трудозатраты на обработку больших массивов бумажной документации. При этом сокращается ручной труд, исключаются неизбежные человеческие ошибки, что в свою очередь повышает уровень достоверности и оперативности обработки потоков информации, поднимает уровень исполнительской дисциплины в компании, значительно улучшает информационную поддержку основного бизнеса.

Быстрый переход по разделу:

Существует ли возможность оптического распознавания текста при введении в систему нового документа или файла в результате сканирования бумажного оригинала?

Такая функция присутствует при загрузке сканированных документов в систему. Для этого нужно включить соответствующий пункт настроек программы. Механизм оптического распознавания текстовой информации базируется на свободном программном решении CuneiForm. Для ознакомления с её функциями советуем посетить следующий ресурс http://www.cuneiform.ru/. Также дополнительные сведения о настройках распознавания текста можно легко найти в интегрированной справке «1С:Д8» и соответствующей документации к ней.

Существует ли возможность полноценного поиска по содержимому отсканированных документов?

Если при введении таких документов осуществлялось распознавание их содержимого, то текстовая информация будет доступна при поиске. Важно заметить, что в случае загрузки в систему только изображений, без последующего распознавания, при поиске можно будет идентифицировать исключительно содержимое метаданных документа или файла.

Возможно ли ознакомиться с демоверсией «1С:Д8» на определённое время без внесения какой-либо оплаты?

Такая возможность реализована с помощью полнофункциональной демоверсии инфобазы «1С:Д8». Она всегда доступна для самостоятельного ознакомления в интернете по следующему адресу http://v8.1c.ru/doc8/demo/. Также полезная дополнительная информация содержится в специальном разделе сайта фирмы «1С», который посвящён «1С:Д8» и круглосуточно доступен по ссылке http://v8.1c.ru/doc8.

Читайте также:  Gigabyte ga ma790x ud4

Существует ли функция объединения отдельных бизнес-процессов в логические цепочки?

К примеру, для выполнения следующей процедуры: контрагент прислал в электронном письме

проект будущего контракта, который становится входящим документом; после череды совещаний было решено создать перечень проблемных вопросов (исходящий документ), которые нужно переслать контрагенту.

Такая возможность существует и для её использования необходимо только задействовать механизм ввода документа на основании.

Какая документация существует в отношении «1С:Д8»?

В полном соответствии с методологией компании «1С», каждая конфигурация «1С:Д8» имеет описание этой модификации, механизмов внутренних процессов и детальную инструкцию по установке и начале взаимодействия со системой.

С помощью имеющейся в «1С:Д8» справки, пользователи системы легко сориентируются при назначении тех или иных объектов по месту применения. Различную дополнительную информацию можно найти по адресу http://v8.1c.ru/doc8.

Много полезной информации в отношении конфигурации «1С:Д8» на постоянной основе публикуется и актуально обновляется на компакт-дисках Информационно-технологической поддержки и на веб-ресурсе ИТС-онлайн по адресу http://its.1c.ru. Доступ к этому сайту может быстро и просто получить каждый пользователь ИТС-онлайн. Также аналогичными источниками распространяется новая информация касательно прочих разработок фирмы «1С».

Как корректно настроить формат итоговых рисунков при сканировании бумажных оригиналов?

  • Чтобы достичь рационального соотношения объёма и качества отсканированных документов рекомендуется использовать следующие параметры:
  • разрешение сканирования в 200 dpi;
  • выберите цветное изображение, формат файлов JPG и примените уровень сжатия 75 — такие установки позволят достичь превосходного качества рисунка и приемлемый размер итогового файла. Поскольку уровень сжатия непосредственно влияет на качество оптического распознавания текста, то после введения вышеуказанных параметров необходимо для пробы отсканировать несколько документов. После их пробного распознавания убедитесь в отсутствие значительных ошибок. Если таковы обнаружатся, то стоит использовать уровни сжатия более чем в 75 пунктов;
  • в случае отсутствия возможности цветной оцифровки документов имеющимся сканером, используйте монохромный режим сканирования и выберете формат PNG для хранения итоговых документов.

Каким образом можно узнать имя и тип криптопровайдера для правильного указания при регулировании настроек криптографии?

Требуемая информация о некоторых наиболее популярных криптопровайдерах перечисленна ниже. Эти данные необходимо указать в диалоге параметров криптографии.

  • КриптоПро CSP: «Crypto-Pro GOST R 34.10-2001 Cryptographic Service Provider» (тип 75);
  • Signal-COM CSP: «Signal-COM CPGOST Cryptographic Provider» (тип 75);
  • ViPNet CSP: «Infotecs Cryptographic Service Provider» (тип 2);
  • Microsoft CSP: «Microsoft Enhanced Cryptographic Provider v1.0» (тип 1).

Если вы используете другой, менее распространённый криптопровайдер, то вам нужно обратиться к его разработчику и запросить необходимые данные.

Каким образом лучше всего организовать процесс введения в «1С:Д8» документов на бумажном носителе?

К примеру, архив контрактов за минувший год.

Для совершения такой манипуляции следует придерживаться такого, наиболее рационального алгоритма действий:

  • самостоятельно сформируйте карточки внутренних документов, заполнив при этом поля: «Корреспондент», «Сумма», «Срок действия» и другие аналогичные при необходимости;
  • распечатайте штрих-код для каждой отдельной карточки — он автоматически присваивается системой при создании каждой карточки. Наклейте его на титульную страницу каждого контракта или изначально распечатайте штрих-код на пустом листе и расположите его в начале пачки отдельного договора;
  • потом осуществите пакетное сканирование контрактов, при этом сканы бумажных оригиналов система в автоматическом режиме присоединит к предварительно созданным карточкам.
  • Ниже представлен приблизительный расчёт выгоды от применения пакетного сканирования.

  • полминуты — сканирование одной бумажной страницы договора на стандартном планшетном сканере с учётом затрат времени на действие «расположить листок в сканер и забрать его обратно»;
  • 5 секунд — время сканирования одной страницы на сканере средней производительности;
  • 2 минуты — регистрация Входящего или Внутреннего документа, распечатка штрих-кода и последующее добавление листочка со штрих-кодом к зарегистрированным документам;
  • стандартный 8-часовой рабочий день без обедов или перерывов — 8*60*60 = 28 800 секунд.

  • в течение одного рабочего дня делопроизводитель сможет зарегистрировать 240 карточек требуемых документов;
  • в среднем каждый документ состоит из двух страниц, соответственно имеем 480 бумажных листов;
  • в случае ручного сканирования такого объёма бумажных оригиналов потребуется 4 часа;
  • при пакетном сканировании того же объёма нужно только 40 минут и ежедневный выигрыш будет составлять 3 часа 20 минут.

Существует ли возможность использования ЭЦП на сервере учреждения без инсталляции криптографического программного обеспечения на компьютеры всех пользователей?

Да, для этого нужно установить соответствующее ПО на компьютеры исключительно тех пользователей, которые ответственны за подписывание документов или файлов. Чтобы другие пользователи имели возможность проверять электронную подпись, нужно настроить такой контроль на сервере. Для этого необходимо поставить отметку в поле «Выполнять проверку ЭП на сервере» в параметрах «1С:Д8», как это сделано на снимке экрана ниже.

При этом будет доступен следующий сценарий использования:

  • уполномоченные сотрудники смогут накладывать электронную подпись на нужные документы и файлы. Они будут иметь соответствующий сертификат цифровой подписи, а на их компьютерах будет инсталлирована необходимая криптографическая программа;

другие работники будут иметь возможность проверять поставленные электронные подписи, но накладывать их не смогут. Соответственно нет необходимости в специальной криптографической программе на их компьютерах. Однако, такая программа должна быть установлена на каждом компьютере кластера серверов «1С:Предприятие». Процедуру лицензирования конкретной криптографической программы при её инсталляции на сервер необходимо уточнять у компании-разработчика такого программного продукта.

Почему не открываются документы для просмотра и редактирования в режиме веб-клиента?

Пожалуйста, проверьте, что в вашем браузере не включена блокировка всплывающих окон. Если она активирована, то отключите её для ресурса, который вы используете в качестве веб-клиента.

Существует ли возможность переноса файлов из инфобазы в том на диске компьютера и каким образом корректно указать путь в формате UNC?

Для перемещения каких-либо файлов из инфобазы в том следуйте такому алгоритму действий:

  • активируйте опцию хранения в томах: пункт меню «Настройка программы» => закладка «Файлы»;
  • создайте один или несколько томов;
  • укажите путь к тому при помощи формата UNC, к примеру «serverfolder»;
  • в случае если том располагается на том же компьютере, на котором функционирует сервер «1С:Предприятие», то необходимо включить общий доступ к нужной папке файловой системы.
Читайте также:  Dialog w 3000 схема

К примеру, для использования папки «c:volume1» в качестве тома осуществите:

  • активацию общего доступа к папке «c:volume1» в закладке Sharing в параметрах папки;
  • правильное указание пути к этой папке «servervolume1». Необходимый путь можно получить, открыв этот компьютер через сетевое окружение.

Начните обработку «Перенос в тома» из раздела «Настройка администрирования».

Применяется ли электронная подпись при обмене документами при помощи МЭДО?

При таком обмене электронная подпись не применяется из-за следующих факторов:

  • МЭДО соответствует ГОСТу Р 53898-2010 и он не предполагает использование цифровой подписи, вместо неё применяются защищённые протоколы обмена документов;
  • при использовании электронной подписи несколькими сторонами передачи данных необходимо развёртывать общий удостоверяющий центр или прибегать к услугам существующих центров, которые предлагают свои услуги за плату. Помимо лишних расходов это приводит к повышенной трудоёмкости, сложности настройки и поддержки такого механизма обмена документами;
  • в соответствии с законом об цифровой подписи, если стороны обмена документами заключают сделку, в которой они признают факт входа отправителя в систему как его достаточную идентификацию, то после совершения такого входа последующая передача документа будет идентична обмену бумажному оригиналу.

При открытии файлов появляется такое уведомление: «Файл . не найден на сервере. Удалить его из рабочего каталога?»

Существует ли способ избавиться от таких сообщений?

Такое уведомление появляется, если требуемый файл был удалён в инфобазе, но одновременно он находится в рабочей папке на компьютере пользователя.

Нужно учитывать, что при сканировании такой папки, к примеру, при открытии нового документа, «1С:Д8» всегда осуществляет проверку всех имеющихся файлов и предлагает пользователю удалить те документы, которые отсутствуют в инфобазе.

Существует ли в «1С:Д8» функция разбора спорных ситуаций при подписании документа?

К примеру, если работник утверждает, что поставил подпись на другую карточку документа или вообще не подписывал этот документ.

Для осуществления разбора таких ситуаций стоит применять следующие функции программы:

  • в случае если работник говорит, что не ставил никаких подписей на спорный документ, то проверьте в протоколах работы пользователя следующие нюансы согласно алгоритму:
  • откройте карточку документа;
  • на закладке «ЭП» найдите сертификат этого работника;
  • в «Панели навигации» перейдите на ссылку «Протокол работы» и отыщите операцию «Подписание ЭП» в отношении этого работника;

если же сотрудник утверждает, что карточка спорного документа была исправлена после того, как он поставил свою подпись, то выполните следующие действия:

  • откройте карточку документа;
  • найдите подпись работника на вкладке «ЭП» и осуществите проверку ЭП. Если проверка показывает, что подписи верны — значит поля «Наименование» и «Краткое содержание», которые защищаются подписью в карточке документа, корректны и были подписаны с помощью ЭП, а правок после этого совершено не было;
  • аналогичный контроль ЭП можно исполнить для файлов, прикреплённых к документу, а также для согласованных виз.

Поддержку каких форматов отсканированных файлов имеет «1С:Д8»?

Для одностраничных документов поддерживаются следующие форматы:

  • bmp,
  • jpg;
  • gif;
  • png;
  • tiff;
  • pdf — в случае установки программ ImageMagick и Ghostscript.
  • Для изображений с несколькими страницами поддерживаются такие форматы:
  • tiff;
  • pdf — в случае установки программ ImageMagick и Ghostscript.

Алгоритм установки ImageMagick и Ghostscript содержится в книге «Описание конфигурации».

Какие настройки сканирования стоит применять при потоковом сканировании?

Оптимальными параметрами сканирования являются следующие:

  • dpi: от 150 до 300;
  • цветность: монохромная, цветная и grayscale;
  • формат файла: tiff, png или jpg.

Каким образом осуществлять сравнение версий документов при использовании MS Word 2013?

Сейчас при выполнении этой операции появляется следующее сообщение:

«<ОбщийМодуль. РаботаСФайламиКлиент.Модуль(6256)>: Ошибка при вызове метода контекста (Merge)Документ.Merge(ПутьКФайлу2, 0, 0, 0); // MergeTarget:=wdMergeTargetSelected, DetectFormatChanges:=False, UseFormattingFrom:=wdFormattingFromCurrent

по причине: Произошла исключительная ситуация (Microsoft Word): Метод или свойство Merge недоступны, потому что эту команду нельзя использовать в режиме чтения.» Для решения такой проблемы необходимо в параметрах Word («Файл» => «Параметры») на вкладке «Общие» снять флажок с пункта «Открывать вложения электронной почты в режиме чтения» как указано на скриншоте ниже.

Что делать если после обновления платформы исчез доступ к файлам, которые хранятся в томах?

С большей долей вероятности в результате обновления изменился пользователь, в аккаунте которого запущен модуль «Агент сервера 1С:Предприятия 8.3». К примеру, по умолчанию используется пользователь USR1CV82, в то время как для работы с документами в томах необходимо применять доменного пользователя типа domain1user1.

Если у вас не получилось, то наш специалист может приехать и решить задачу.

Настроим. Подключим. Исправим. Найдем ошибку 1с.

Лидеры продаж!

1С: Упрощенка 8

"1С:Упрощенка 8" является спец-поставкой программы "1С:Бухгалтерия 8. Базовая версия", которая предварительно настроена для ведения учета по УСН. При этом в "1С:Упрощенке 8" сохранены все возможности "1С:Бухгалтерии 8" – достаточно изменить настройку и можно вести полноценный учет для организаций, применяющих общий режим налогообложения и уплачивающих налог на прибыль.

1С: Бухгалтерия 8

"Программа 1С Бухгалтерия 8 создана для автоматизации бухгалтерского и налогового учета, включая подготовку обязательной регламентированной отчетности, на коммерческих предприятиях: оптовую и розничную торговлю, комиссионную торговлю, оказание услуг, производство и тому подобное.

1С: Предприниматель 8

Программа "1С:Предприниматель 8" — создана для ведения бухгалтерского учета и составления отчетности индивидуальными предпринимателями ИП, ЧП, ПБОЮЛ. Программа позволяет вести Книгу учета доходов и расходов и хозяйственных операций индивидуальных предпринимателей, являющихся плательщиками налога на доходы физических лиц (НДФЛ).

1С: Предприятие 8 Лицензии.

При необходимости работать с программой 1С более чем на одном компьютере (это может быть локальная сеть), а также при работе в одной базе 1С, возникает необходимость купить лицензии 1С. Лицензии 1С — это дополнительные ключи защиты программ 1С, которые покупаются отдельно и дают право пользоваться на несколько компьютеров.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *