АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

convmv - Интернет в облаке

Запустите convmv в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда convmv, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


convmv - преобразует имена файлов из одной кодировки в другую

СИНТАКСИС


конвмв [кредита] ФАЙЛ (И) ... КАТАЛОГ (И)

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-f КОДИРОВАНИЕ
укажите текущую кодировку имени файла (имен), из которого следует преобразовать

-t КОДИРОВАНИЕ
укажите кодировку, в которую должны быть преобразованы имена файлов

-i интерактивный режим (спрашивайте y / n для каждого действия)

-r рекурсивно просматривать каталоги

--nfc
целевые файлы будут нормализованной формой C для UTF-8 (Linux и т. д.)

--nfd
целевые файлы будут нормализованной формой D для UTF-8 (OS X и т. д.).

--qfrom , --qto
молчите о "от" или "до" переименования (если это испортит ваш терминал
например). Фактически это не сделает ничего, кроме замены любого символа, отличного от ASCII.
(побайтно) с помощью? и любой управляющий символ с * на распечатке, это не влияет
переименовать саму операцию.

--exec команду
выполнить данную команду. Вы должны процитировать команду, и # 1 будет заменен на
старый, # 2 по новому имени файла. При использовании этого параметра цели ссылки останутся нетронутыми.

Пример:

convmv -f latin1 -t utf-8 -r --exec "echo # 1 следует переименовать в # 2" путь / к / файлам

--список
перечислить все доступные кодировки. Чтобы получить поддержку для большего количества китайских или японских кодировок
установите пакеты Perl HanExtra или JIS2K Encode.

--lowmem
уменьшить объем памяти, не создавая хеш-значения всех файлов. Это отключает проверку
если цели символической ссылки находятся в поддереве. Указатели цели Symlink будут преобразованы
независимо от того. Если вы конвертируете несколько сотен тысяч или миллионов файлов, память
использование convmv может значительно вырасти. Этот вариант поможет вам в таком случае.

--носмарт
по умолчанию convmv определит, если имя файла уже закодировано в UTF8, и пропустит это
файл, если необходимо выполнить преобразование из некоторой кодировки в UTF8. "--носмарт" будет
также принудительно преобразовать такие файлы в UTF-8, что может привести к "двойному кодированию
UTF-8 "(см. Раздел ниже).

--fixdouble
используя параметр "--fixdouble", convmv конвертирует только файлы, которые по-прежнему будут
Кодировка UTF-8 после преобразования. Это полезно для исправления файлов UTF-8 с двойной кодировкой.
Все файлы, которые не являются UTF-8 или не будут отображаться в UTF-8 после преобразования, не будут
коснулся. Также см. Главу «Как отменить двойной UTF-8 ...» ниже.

--примечание
Требуется фактически переименовать файлы. По умолчанию convmv просто печатает то, что хочет
сделать.

- анализируемый
Это расширенный вариант, который найдут люди, которые хотят написать интерфейс с графическим интерфейсом.
полезно (может быть, и другие). Он будет распечатывать то, что он будет делать в
простой способ разбора. Первый столбец содержит действие или какую-то информацию,
второй столбец в основном содержит файл, который нужно изменить и, если необходимо
третий столбец содержит измененное значение. Каждый столбец разделен \ 0 \ n
(новая строка нулевого байта). Каждая строка (одно действие) разделяется \ 0 \ 0 \ n (нульбайт нульбайт
новая линия).

--no-сохранить-mtimes
изменение имен файлов обычно вызывает обновление mtime родительского каталога. С
версия 2 convmv по умолчанию сбрасывает mtime на старое значение. Если ваша файловая система
поддерживает субсекундное разрешение, субсекундная часть atime и mtime будут потеряны
поскольку Perl еще не поддерживает это. С помощью этой опции вы можете запрещать сохранение
из времен.

--заменять
если файл, который нужно переименовать, уже существует, он будет перезаписан, если
остальное содержимое файла такое же.

- пейзаж
эта опция удалит эти уродливые% шестнадцатеричные последовательности из имен файлов и превратит их в
(надеюсь) более приятные 8-битные символы. После --unescape вы можете захотеть сделать кодировку
конверсия. Такие последовательности, как% 20 и т. Д., Иногда создаются при загрузке через
http или ftp.

- верхний , --ниже
превращать имена файлов в верхний или нижний регистр. Если файл не имеет кодировки ASCII,
convmv ожидает, что кодировка будет введена с помощью переключателя -f.

--map =какое-то экстра-отображение
применить некоторые пользовательские сопоставления символов, в настоящее время поддерживаются:

ntfs-sfm (-undo), ntfs-sfu (-undo) для сопоставления недопустимых символов ntfs для Linux
или клиенты Macintosh cifs (см. MS KB 117258, а также параметр монтирования mapchars файла mount.cifs
в Linux).

ntfs-pretty (-undo) для сопоставления недопустимых символов ntfs с довольно легальными
Японские их версии.

Смотрите пост в map_get_newname () функция, как легко добавлять собственные сопоставления, если это необходимо. Разрешите
знайте, если вы думаете, что в convmv здесь отсутствует какое-то полезное сопоставление.

--dotlessi
заботиться о проблеме без точек ввода / вывода. Версия "I" в нижнем регистре также будет без точки.
в то время как версия «i» в верхнем регистре также будет разделена точками. Это проблема для турецкого
и азербайджанский.

Кстати: надстрочная точка буквы i была добавлена ​​в средние века к
отличать букву (в рукописях) от соседних вертикальных штрихов в таких буквах
как u, m и n. J - вариантная форма i, появившаяся в это время и впоследствии
стало отдельным письмом.

--Помогите
распечатать краткую сводку доступных опций

--dump-параметры
распечатать список всех доступных опций

ОПИСАНИЕ


конвмв предназначен для преобразования одного файла, дерева каталогов и содержащихся в нем
файлы или целую файловую систему в другую кодировку. Он просто преобразует имена файлов, а не
содержимое файлов. Особенностью convmv является то, что он также заботится о
символические ссылки, также преобразует целевой указатель символической ссылки в случае, если цель символической ссылки
преобразован тоже.

Все это очень удобно, когда кто-то хочет перейти со старых 8-битных языков на UTF-8.
локации. Также возможно преобразовать каталоги в UTF-8, которые уже частично
Кодировка UTF-8. convmv может определить, имеют ли определенные файлы кодировку UTF-8, и пропустит
их по умолчанию. Чтобы отключить эту «умность», используйте переключатель «--nosmart».

Файловая система вопросы
Почти все файловые системы POSIX не заботятся о том, как закодированы имена файлов, вот некоторые
исключения:

HFS + on OS X / Дарвин

Linux и (большинство?) Других Unix-подобных операционных систем используют так называемую форму нормализации C.
(NFC) для кодировки UTF-8 по умолчанию, но не применяйте это принудительно. Дарвин, основа
Macintosh OS применяет форму нормализации D (NFD), где несколько символов закодированы в
по-другому. В OS X невозможно создать имена файлов NFC UTF-8, потому что это
предотвращено на уровне файловой системы. В HFS + имена файлов внутри хранятся в UTF-16, а когда
преобразован обратно в UTF-8, чтобы базовая система BSD могла быть управляемой, создается NFD.
Читать http://developer.apple.com/qa/qa2001/qa1173.html за дефолты. Я думаю это было очень
плохая идея и ломает многие вещи под OS X, которые ожидаются от нормальной POSIX-совместимой системы.
В любом другом месте convmv может конвертировать файлы из NFC в NFD или наоборот, что делает
взаимодействие с такими системами намного проще.

JFS

Если люди монтируют разделы JFS с помощью iocharset = utf8, возникает аналогичная проблема, потому что
JFS также предназначен для внутреннего хранения имен файлов в UTF-16; это потому, что Linux JFS
на самом деле JFS2, который был переписанным JFS для OS / 2. Разделы JFS всегда должны быть
смонтирован с помощью iocharset = iso8859-1, который также является значением по умолчанию для последних ядер 2.6.6. Если
этого не происходит, JFS не ведет себя как файловая система POSIX, и может случиться так, что
некоторые файлы не могут быть созданы вообще, например имена файлов в кодировке ISO-8859-1. Только
когда требуется взаимодействие с OS / 2, необходимо установить iocharset в соответствии с используемым вами
местный шармап.

НФС4

Несмотря на другие файловые системы POSIX, RFC3530 (NFS 4) требует UTF-8, но также говорит:
Профиль nfs4_cs_prep не определяет форму нормализации. Более поздняя редакция этого
спецификация может указывать конкретную форму нормализации ". Другими словами, если вы хотите
используйте NFS4, вы можете найти функции преобразования и нормализации в convmv весьма полезными.

FAT / VFAT и NTFS

NTFS и VFAT (для длинных имен файлов) внутренне используют UTF-16 для хранения имен файлов. Вам следует
нет необходимости преобразовывать имена файлов, если вы монтируете одну из этих файловых систем. Используйте соответствующие
вместо этого смонтируйте параметры!

Как в отменить двойной UTF-8 (или Другие) закодированный имена файлов
Иногда может случиться так, что вы "дважды закодировали" определенные имена файлов, например
имена файлов уже были в кодировке UTF-8, и вы случайно выполнили другое преобразование из некоторых
кодировка в UTF-8. Вы можете просто отменить это, преобразовав это наоборот. В
from-charset должен быть UTF-8, а to-charset должен быть кодировкой from, которую вы ранее
случайно использовал. Если вы используете параметр "--fixdouble", convmv гарантирует, что только
будут обрабатываться файлы, которые по-прежнему будут закодированы в кодировке UTF-8 после преобразования, и
оставьте файлы, отличные от UTF-8, нетронутыми. Вы должны проверить, чтобы получить правильные результаты, выполнив
преобразование без "--notest" перед этим, также может быть полезна опция "--qfrom", потому что
двойные имена файлов utf-8 могут испортить ваш терминал, если они печатаются - они
часто содержат управляющие последовательности, которые делают забавные вещи с окном вашего терминала. если ты
не уверены в кодировке, из которой было случайно преобразовано, использование "--qfrom" является
хороший способ изменить требуемую кодировку без окончательного уничтожения имен файлов.

Как в ремонт самба файлов
Когда в smb.conf (Samba 2.x) не был установлен правильный "набор символов"
переменная, файлы, созданные из клиентов Win *, создаются в клиентской
кодовая страница, например cp850 для западноевропейских языков. В результате файлы, которые
содержат символы, отличные от ASCII, будут запутаны, если вы "ls" их на сервере Unix. если ты
впоследствии измените переменную "набора символов" на iso8859-1, вновь созданные файлы в порядке,
но старые файлы по-прежнему испорчены в кодировке Windows. В этом случае convmv может
также может использоваться для преобразования старых общих файлов Samba из cp850 в iso8859-1.

Между прочим: Samba 3.x, наконец, по умолчанию сопоставляется с именами файлов UTF-8, поэтому также при миграции
из Samba 2 в Samba 3 вам, возможно, придется преобразовать имена файлов.

Сетевой обмен совместимость вопросы
Когда Netatalk переключается на UTF-8, который поддерживается в версии 2, это НЕ
достаточно переименовать имена файлов. Необходимо сделать больше. Видеть
http://netatalk.sourceforge.net/2.0/htmldocs/upgrade.html# имена-тома-и-файлов и
Утилита uniconv Netatalk для подробностей.

Используйте convmv онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad