АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

comb_tessdata - Онлайн в облаке

Запустите comb_tessdata в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда comb_tessdata, которую можно запустить в провайдере бесплатного хостинга OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


comb_tessdata - объединить / извлечь / перезаписать данные Tesseract

СИНТАКСИС


comb_tessdata [ВАРИАНТ] ФАЙЛОВ...

ОПИСАНИЕ


comb_tessdata(1) - это основная программа для объединения / извлечения / перезаписи компонентов tessdata
в файлах [lang] .traineddata.

Чтобы объединить все отдельные компоненты tessdata (unicharset, DAWG, классификатор
шаблоны, неоднозначности, языковые конфигурации), расположенные, скажем, /Главная/$ USER / temp / eng. * Запустить:

comb_tessdata /Главная/$ USER / темп / англ.

Результатом будет комбинированный файл tessdata /Главная/$ USER / temp / eng.traineddata

Укажите опцию -e, если вы хотите извлечь отдельные компоненты из комбинированного
файл обученных данных. Например, чтобы извлечь файл конфигурации языка и кодировку unicharset из
tessdata / eng.traineddata run:

comb_tessdata -e tessdata / eng.traineddata \
/Главная/$ USER / temp / eng.config /Главная/$ USER / temp / eng.unicharset

Желаемый конфигурационный файл и unicharset будут записаны в /Главная/$ USER / temp / eng.config
/Главная/$ USER / temp / eng.unicharset

Укажите опцию -o, чтобы перезаписать отдельные компоненты данного файла [lang] .traineddata.
Например, чтобы перезаписать файлы конфигурации языка и неоднозначности unichar в
tessdata / eng.trained использование данных:

comb_tessdata -o tessdata / eng.traineddata \
/Главная/$ USER / temp / eng.config /Главная/$ USER / temp / eng.unicharambigs

В результате tessdata / eng.traineddata будет содержать новую языковую конфигурацию и unichar
неоднозначности, плюс все оригинальные DAWG, шаблоны классификаторов и т. д.

Примечание: имена файлов для извлечения и перезаписи должны иметь
соответствующие суффиксы (расширения) файлов, указывающие их тип компонента tessdata
(.unicharset для unicharset, .unicharambigs для символов unichar и т. д.). См. K * FileSuffix
переменная в ccutil / tessdatamanager.h.

Укажите опцию -u, чтобы распаковать все компоненты по указанному пути:

comb_tessdata -u tessdata / eng.traineddata /Главная/$ USER / темп / англ.

Это создаст /Главная/$ USER / temp / eng. * Файлы с отдельными компонентами tessdata из
tessdata / англ .traineddata.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-e .traineddata ФАЙЛОВ...: извлекает указанные компоненты из файла .traineddata.

-o .traineddata ФАЙЛОВ...: заменяет указанные компоненты файла .traineddata на
те, что указаны в командной строке.

-u .traineddata ПУТЬПРЕФИКС Распаковывает .traineddata с использованием предоставленного префикса.

Пещеры


Префикс относится к полному префиксу файла, включая точку (.)

КОМПОНЕНТЫ


Компоненты в файле Tesseract lang.traineddata версии Tesseract 3.02 вкратце
описано ниже; Для получения дополнительной информации о многих из этих файлов см.
https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract

язык.конфигурация
(Необязательно) Зависящие от языка переопределения переменных конфигурации по умолчанию.

язык.unicharset
(Обязательно) Список символов, которые распознает Tesseract, со свойствами. Видеть
Unicharset(5).

язык.unicharambigs
(Необязательно) Этот файл содержит информацию о парах распознанных символов, которые
часто путают. Например, rn и m.

язык.inttemp
(Обязательно) Шаблоны форм персонажей для каждого unichar. Произведено обучение(1).

lang.pffmtable
(Обязательно) Ожидаемое количество функций для каждого unichar. Произведено обучение(1)
от .tr файлы.

язык.нормпрото
(Обязательно) Прототипы нормализации символов, созданные обучение(1) из .tr
файлы.

lang.punc-dawg
(Необязательно) Значок, сделанный из знаков препинания вокруг слов. Часть "слова"
заменяется одним пробелом.

язык.слово-чувак
(Необязательно) Тест, сделанный из словарных слов языка.

lang.number-dawg
(Необязательно) Значок, сделанный из токенов, изначально содержащих цифры. Каждая цифра
заменяется пробелом.

lang.freq-dawg
(Необязательно) Помет, составленный из наиболее часто встречающихся слов, которые могли бы войти в
слово-чувак.

lang.fixed-length-dawgs
(Необязательно) Несколько гаек разной фиксированной длины - полезно для таких языков, как
Китайский.

lang.cube-unicharset
(Необязательно) Unicharset для куба, если куб был обучен на другом наборе символов.

lang.cube-word-dawg
(Необязательно) Слово dawg для альтернативной унифицированной кодировки куба. Не требуется, если Cube был обучен
с unicharset Тессеракта.

язык.формируемый
(Необязательно) Если присутствует, фигурка - это дополнительный слой между персонажами.
классификатор и распознаватель слов, который позволяет классификатору символов возвращать
коллекция идентификаторов unichar и шрифтов вместо одного unichar-id и шрифта.

lang.bigram-dawg
(Необязательно) Набор биграмм слов, в которых слова разделены пробелом, и каждый
цифра заменяется на ?.

lang.unambig-dawg
(Необязательно) ЗАДАЧА: Опишите.

lang.params-обучение-модель
(Необязательно) ЗАДАЧА: Опишите.

ИСТОРИЯ


comb_tessdata(1) впервые появился в версии 3.00 Tesseract.

Используйте comb_tessdata онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    JXplorer - браузер Java Ldap
    JXplorer - браузер Java Ldap
    Java-клиент LDAP с поддержкой LDIF,
    безопасность (включая SSL, SASL и GSSAPI),
    переведен на многие языки (в т.
    китайский), интерактивную справку, пользовательские формы и
    многие другие ...
    Скачать JXplorer — браузер Java Ldap
  • 2
    PosteRazor - Создайте свой собственный плакат!
    PosteRazor - Создайте свой собственный плакат!
    Хотите напечатать плакат? PosteRazor режет
    файл изображения на части, и вы можете
    распечатайте потом на принтере и приклейте
    вместе к плакату. Простой на основе FLTK
    использовать ...
    Скачать PosteRazor - Создайте свой собственный постер!
  • 3
    Pharser
    Pharser
    Phaser - это быстрый, бесплатный и увлекательный
    исходный игровой фреймворк HTML5, который предлагает
    WebGL и рендеринг Canvas через
    настольные и мобильные веб-браузеры. Игры
    может быть со ...
    Скачать Фазер
  • 4
    VASSAL Двигатель
    VASSAL Двигатель
    VASSAL - игровой движок для создания
    электронные версии традиционной доски
    и карточные игры. Он обеспечивает поддержку
    рендеринг и взаимодействие игровых элементов,
    и ...
    Скачать движок VASSAL
  • 5
    OpenPDF - форк iText
    OpenPDF - форк iText
    OpenPDF — это библиотека Java для создания
    и редактирование PDF-файлов с помощью LGPL и
    Лицензия с открытым исходным кодом MPL. OpenPDF – это
    LGPL/MPL преемник iText с открытым исходным кодом,
    и ...
    Скачать OpenPDF — форк iText
  • 6
    SAGA GIS
    SAGA GIS
    САГА - Автоматизированная система
    Геонаучный анализ - это географический
    Программное обеспечение информационной системы (ГИС) с
    огромные возможности для геоданных
    обработка и анализ ...
    Скачать ГИС САГА
  • Больше »

Команды Linux

  • 1
    aarch64-linux-gnu-gnatbind
    aarch64-linux-gnu-gnatbind
    комар, gnatbind, gnatbl, gnatchop,
    гнатфинд, гнаттмл, гнаткр, гнатлинк,
    гнатлы, гнатмейке, гнатпреп, гнатпста,
    gnatpsys, gnatxref — набор инструментов GNAT
    ОПИСАНИЕ: Т...
    Запустите aarch64-linux-gnu-gnatbind
  • 2
    aarch64-linux-gnu-gnathop-5
    aarch64-linux-gnu-gnathop-5
    комар, gnatbind, gnatbl, gnatchop,
    гнатфинд, гнаттмл, гнаткр, гнатлинк,
    гнатлы, гнатмейке, гнатпреп, гнатпста,
    gnatpsys, gnatxref — набор инструментов GNAT
    ОПИСАНИЕ: Т...
    Запустите aarch64-linux-gnu-gnatchop-5
  • 3
    cpupower-idle-информация
    cpupower-idle-информация
    cpupower Idle-info — Утилита для
    получить информацию о простое ядра процессора
    СИНТАКСИС: мощность процессора [ -c список процессоров ]
    Idle-info [опции] ОПИСАНИЕ: Инструмент
    который печатает p...
    Запустите cpupower-idle-info
  • 4
    cpupower-idle-set
    cpupower-idle-set
    cpupower Idle-Set — Утилита для настройки процессора
    специальные параметры ядра для состояния простоя
    СИНТАКСИС: мощность процессора [ -c список процессоров ]
    Idle-info [опции] ОПИСАНИЕ:
    мощность процессора в режиме ожидания...
    Запустите cpupower-idle-set
  • 5
    g.mapsetsgrass
    g.mapsetsgrass
    g.mapsets — изменяет/печатает пользовательские
    текущий путь поиска набора карт. Влияет на
    доступ пользователя к данным, существующим в рамках
    другие наборы карт в текущем местоположении. ...
    Запустите g.mapsetsgrass
  • 6
    г.messagegrass
    г.messagegrass
    g.message — печатает сообщение, предупреждение,
    информация о ходе выполнения или фатальная ошибка в
    ТРАВЯНОЙ путь. Этот модуль следует использовать в
    сценарии для сообщений, доставляемых пользователю.
    КЕЙВО...
    Запустите g.messagegrass
  • Больше »

Ad