1. Главная страница » Компьютеры

Http www onlineocr net

Автор: | 16.12.2019

Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.

Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.

Для примера распознавала фотографию документа, который есть у каждого – свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).

Сервис Нужна регистрация Рейтинг Адрес
Google да 3 https://drive.google.com/drive
Abbyy Finereader да 5 https://finereaderonline.com/ru-ru
Online OCR2 5 http://www.onlineocr.net
Free Online OCR 2 https://www.newocr.com
OCR Convert 4 http://www.ocrconvert.com
Free OCR 1 www.free-ocr.com
I2OCR 4 http://www.i2ocr.com
Яндекс ОCR Распознает и переводит. 5 https://translate.yandex.ru/ocr
Convertio Работает своеобразно 3 https://convertio.co/ru/ocr/

Google

В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.

Входные форматы PDF , JPEG, PNG, GIF
Выходные форматы Word, Open Document, RTF, Adobe PDF, HTML, Text Plain, Epub (но форматирование исчезает – нарушается компоновка картинок с текстом)
Размер файла До 2 Мб
Ограничения Ограничено только размером хранилищ Google.

Качество исходника рекоменовано не меньше 10 пикселей по высоте для строки.

Качество Так себе – качество распознавания свидетельства инн хуже, чем с Finereader. И ФИО, и номер инн полностью потеряны.

Как пользоваться

  1. Загрузите файл на страницу drive.google.com или выберите там уже загруженную картинку
  2. Нажмите правой кнопкой мыши на нужный файл.
  3. Выберите “Открыть с помощью” –> “Google Документы”.
  4. Картинка преобразуется в документ Google и откроется на вкладке https://docs.google.com
Читайте также:  Might and magic x legacy затерянный город

Abbyy Finereader

В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия – можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р). Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.

Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG
Выходные форматы Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub
Размер файла До 100Мб
Ограничения 10 картинок на две недели
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Online OCR – какие-то части документа лучше распознались тем сервисом, а какие-то – этим.

Результат распознавания Finereader. (ФИО и город распознаны, но стерты вручную)

Как пользоваться

  1. Загрузите файлы
  2. Выберите язык
  3. Выберите выходной формат
  4. Щелкните кнопку «Распознать»

Распознавание текста онлайн без регистрации

Online OCR

Online OCR http://www.onlineocr.net/ – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:

Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)

Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG, GIF
Выходные форматы Word, Excel, Adobe PDF, Text Plain
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Распознает не более 15 картинок в час без регистрации
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим.

Как пользоваться

  1. Загрузите файл (щелкните «Select File»)
  2. Выберите язык и выходной формат
  3. Введите капчу и щелкните «Convert»

Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым

Free Online OCR

Free Online OCR https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).

Входные форматы PDF, DjVu JPEG, PNG, GIF, BMP, TIFF
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Ограничения на количество нет
Качество Качество распознавания свидетельства инн плохое.

Можно распознавать как все целиком, так и выделить часть изображения для распознавания.

Как пользоваться

  1. Выберите файл или вставьте url файла и щелкните «Preview» – картинка загрузится и появится в окне браузера Не забудьте правильно указать язык.
  2. Выберите область сканирования (можно оставить целиком как есть)
  3. Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»
  4. Внизу появится окно с текстом

OCR Convert

OCR Convert http://www.ocrconvert.com/ txt

Входные форматы Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 5Мб общий размер файлов за один раз.
Ограничения Одновременно до 5 файлов. Сколько угодно раз.
Качество Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader

Как пользоваться

    1. Загрузите файл, выберите язык и щелкните кнопку «Process»

    Free OCR

    Free OCR www.free-ocr.com распознал документ хуже всех.

    Входные форматы PDF, JPG, PNG, BMP, GIF, TIFF
    Выходные форматы Text Plain
    Размер файла До 6Мб
    Ограничения У PDF-файла распознается только первая страница
    Качество Качество распознавания свидетельства инн низкое – правильно распознано только три слова.

    Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Щелкните кнопку “Start”

      I2OCR

      I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.

      Входные форматы JPG, PNG, BMP, TIF, PBM, PGM, PPM
      Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
      Размер файла До 10Мб
      Ограничения нет
      Качество Качество распознавания свидетельства инн среднее – сравнимо с OCR Convert.

      Замечено, что сервис временами не работает.

      Как пользоваться

      1. Выберите язык
      2. Загрузите файл
      3. Введите капчу
      4. Щелкните кнопку «Extract text»
      5. По кнопке «Download» можно загрузить выходной файл в нужном формате

        Яндекс OCR

        Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.

        Просто перейдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и щелкните “Открыть в Переводчике”. Откроется как текст с картинки, так и перевод в правом поле.

        Перетащите картинку Результат распознавания

        Convertio

        Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, поэтому сравнивать его тяжело. В целом не понравился. Свидетельство ИНН, загруженное целиком, он не распознал совсем, так как плохо выделяет текст среди картинок. Не распозналось ни одного слова! Для его проверки я вырезала текстовый кусочек из ИНН и распознала его – это удалось сделать.

        К тому же временами он зависает в попытках что-либо распознать.

        Входные форматы pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp, webp
        Выходные форматы Text Plain, PDF, Word , Excel, Pptx, Djvu, Epub, Fb2, Csv
        Размер файла ?, зависит от тарифа
        Ограничения 10 страниц бесплатно, дальше тарифы от 7 долларов.
        Качество Сложно оценить – файл с картинками (ИНН) не распознал совсем, отдельно вырезанный кусок текста распознал.

        Замечено, что при распознавании сервис временами зависает, возможно ваши картинки ставятся в большую очередь на бесплатном тарифе.

        Как пользоваться

        1. Загрузите файл
        2. Выберите язык
        3. Выберите выходной формат
        4. Введите капчу
        5. Щелкните “Преобразовать”
        6. Чтобы увидеть результат, промотайте наверх к форме загрузки файлов. Там же можно будет и скачать результат.

        Интерфейс Convertio

        Вырезанный и распознанный кусок (целиком не распознается):

        Результат работы Convertio

        Заключение

        Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.

        Хуже всего сработал Free OCR – он распознал всего три слова.

        Распознавание текста онлайн — ТОП-9 сервисов: 3 комментария

        СПАСИБО! И меня очень выручили… по поиску в яндексе мои попытки тоже были безуспешные, а статья помогла и выбрала отличный ресурс, который преобразовал все 30 страниц) к слову, нужно было очень быстро и срочно!)))

        если есть такая возможность то напишите пожалуйста
        есть страничка
        на ней картинки с текстом
        конкретно адреса электронной почты
        https://www.math.fsu.edu/People/faculty.php
        вопрос можно ли вытащить каким то средствами текст этих адресов

        согласен что это не хорошо но увы нужно

        сделайте скриншот, да распознайте картинку. Правда, качество там не очень

        Описание

        Допустимые форматы: pdf (в т.ч. многостраничные), jpg, gif, jp2, jpeg, png, tiff (в т.ч. многостраничные), webp

        Сервис позволяет бесплатно распознать текст онлайн с картинок и pdf файлов. После распознавания можно проверить текст на уникальность и орфографические ошибки. Результаты распознавания доступны по секретной ссылке, которой можно поделиться. Ссылка на результаты OCR хранится 7 дней.

        Рекомендации

        Для лучшего распознавания используйте картинки с разрешением не менее 300 dpi.

        Старайтесь, чтобы строки текста располагались горизонтально, поправьте предварительно картинки в графическом редакторе, если строки слишком завалены.

        Желательно обрезать ненужные края, особенно если там есть элементы, похожие на текст.

        Оптимальным для распознавания являются картинки, сканированные планшетным сканером.

        В процессе написания реферата, дипломной работы или подготавливая доклад на заданную тему учащийся (абитуриент) использует довольно большие массивы информации. Именно в такие моменты пользователю может потребоваться услуга онлайн распознавание текста с картинки. Ведь зачастую необходимый для работы документ имеет не совсем приемлемый формат, а также может быть в виде скана, картинки или скриншота. В следствии чего, полноценное использование текстового материала с последующим применением основных элементов редактирования просто невозможно без программной поддержки онлайн инструментов, о которых и пойдет речь в этой статье.

        Наиболее корректный распознаватель текста — Finereaderonline

        Безусловным лидером представленного обзора является именно этот онлайн сервис. И все же, сразу оговоримся, среди бесконечного списка преимуществ данного текстового агрегатора нашлось и место для недостатков.

        Существенный минус — это отсутствие бесплатной формы использования. Ограниченный вариант ознакомления с возможностями сервиса все же доступен, если вы пройдете весьма простой процесс регистрации.

        В течении 15-ти дней вам дается право «распознать» десять документов. По истечении этого срока, а также исчерпав лимит на обработку данных необходимо купить один из аккаунтов доступа.

        Совершенно бесплатные сервисы распознавания текста
        [adsense2]
        Таковых во Всемирной паутине невероятное множество. Однако наш выбор должен отвечать следующим критериям:

        • Простота и неограниченность в использовании.
        • Инструмент обязательно должен поддерживать русский язык.
        • Высокий уровень функциональности.

        Несмотря на соответствие ниже представленных сервисов упомянутым условиям, все же велика вероятность того, что в результате распознавания вы получите не совсем читабельный текст.

        В некоторых случаях придется подкорректировать полученный контент, так сказать вручную. Тем не менее, это все же лучше, нежели руками перепечатывать большие объемы сканированного текста.

        Free Online OCR — очень мощный инструмент распознавания

        Без регистрации и каких-либо ограничений вы можете производить операции OCR преобразования с файлами следующих форматов: JPEG, PNG, GIF, JFIF, BMP, PBM, PPM, PGM, PCX, а также документов с расширением — TIFF, PDF, DjVu, DOCX, ODT и даже загружать на обработку некоторые ZIP архивы.

        Сервис способен распознать 106 языков. Что немаловажно Free Online OCR поддерживает пакетную обработку данных. То есть загрузив многостраничный PDF файл вам останется лишь немного подождать, пока не будет завершен процесс распознавания. Сохранить на ПК полученный результат можно в виде: TXT, DOC, ODT, RTF, PDF или HTML документа.

        Хотите попробовать Free Online OCR в действии, вам сюда — https://www.newocr.com/.

        i2OCR — самый «объемный» обработчик

        Используя данный веб инструмент, вы сможете загружать картинки и документы размером до 10 МБ. Незначительные неудобства в работе сервиса — это периодический ввод капчи.

        Помимо основной функции распознавания i2OCR оснащен несколькими специальными кнопками навигации, посредством которых можно осуществить комфортный переход в определенную область редактирования.

        Что касается поддерживаемых форматов графических файлов, то здесь воспринимаются основные и широко применяемые, все те же — JPG — PNG — BMP — TIF — РВМ — PGM – PPM. Вывод итогового документа можно произвести в виде DOC, PDF или TXT файла.

        Воспользоваться данным сервисом можно здесь — http://www.i2ocr.com/.

        OnlineOcr

        Достаточно быстро функционирующий сервис позволяет в течении одного часа провести распознание 15-ти документов. Размер каждого из них (по отдельности) не должен превышать 5 МБ.

        OnlineOcr поддерживает следующие графические форматы: JPEG, TIFF, BMP и GIF.

        По завершению операции перевода текста из графического состояния в символьный формат, полученный результат можно сохранить в виде MS Word (DOC) или MS Excel (XLS) документа, а также с расширением TXT.

        Попробовать инструмент в работе — http://www.onlineocr.net/

        В заключение

        Что ж, возможно какой-либо из сервисов вам действительно понравиться и, надеемся, окажется невероятно полезным. Ну а напоследок хочется дать вам, уважаемый читатель, несколько полезных советов. Во-первых, чтобы получить действительно качественный результат — первичный документ должен быть в высоком разрешении. Второе, всегда обращайте внимание на кнопку, где выбирается язык распознавания. Ну и третье, если первая «попытка» не принесла ожидаемого результата, то стоит попробовать другой вариант и даже следующий. В любом случае, знайте — безвыходных ситуаций не бывает!

        Попробовал «Free online OCR» ввода капчи ни разу не обнаружил, убило только то, что за раз распознаётся всего одна страница, и с 415-ю страницами нужной мне книги пришлось потратить весьма изрядное количество времени. На «AABBYY online Fine Reader» программа тоже книгу распознать не смогла но прочла 5 страниц за раз, однако при цене 25 руб/страница распознавание выйдет дороже повторной покупки той же книги в нужном формате. На «Online — OCR» порадовала возможность загружать распознанные страницы последовательно в один файл и автоматический переход от страницы к странице, недостаток тот же, что и у её тёзки «Free» распознавание за раз только одной страницы.

        Добавить комментарий

        Ваш адрес email не будет опубликован. Обязательные поля помечены *