англійськафранцузькаіспанська

Ad


Значок OnWorks

convmv - онлайн у хмарі

Запустіть convmv у постачальнику безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда convmv, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн емулятор Windows або онлайн емулятор MAC OS

ПРОГРАМА:

ІМ'Я


convmv - перетворює імена файлів з одного кодування в інше

СИНТАКСИС


convmv [опції] ФАЙЛ(И) ... КАТАЛОГ(И)

ВАРІАНТИ


-f КОДУВАННЯ
вкажіть поточне кодування імен файлів, з яких потрібно конвертувати

-t КОДУВАННЯ
вкажіть кодування, у яке має бути конвертовано назви файлів

-i інтерактивний режим (запитуйте y/n для кожної дії)

-r рекурсивно переглядати каталоги

--nfc
цільові файли будуть у формі нормалізації C для UTF-8 (Linux тощо)

--nfd
цільові файли будуть у формі нормалізації D для UTF-8 (OS X тощо).

--qвід , --qto
будьте тихіше щодо «від» або «до» перейменування (якщо це зіпсує ваш термінал
наприклад). Насправді це не буде робити нічого іншого, як замінити будь-який не-ASCII символ
(побайтно) з ? і будь-який контрольний символ із * на роздруківці, це не впливає
перейменувати саму операцію.

--викон команда
виконати задану команду. Ви повинні процитувати команду, і номер 1 буде замінено на
старий, №2 за новим ім'ям файлу. Використовуючи цю опцію, цілі посилань залишаться недоторканими.

приклад:

convmv -f latin1 -t utf-8 -r --exec "echo #1 слід перейменувати на #2" шлях/до/файлів

-- список
перерахувати всі доступні кодування. Щоб отримати підтримку більше китайських або японських кодувань
встановити пакети Perl HanExtra або JIS2K Encode.

--lowmem
зберігайте низький обсяг пам’яті, не створюючи хеш усіх файлів. Це вимикає перевірку
якщо цілі символічного посилання знаходяться в піддереві. Цільові покажчики символічного посилання будуть перетворені
незалежно від того. Якщо ви конвертуєте кілька сотень тисяч або мільйонів файлів, пам'ять
використання convmv може стати досить високим. Цей варіант допоможе вам у цьому випадку.

--носумний
за замовчуванням convmv визначить, чи ім'я файлу вже закодовано UTF8, і пропустить це
файл, якщо має бути виконано перетворення з деякого набору символів у UTF8. "--nosmart" буде
також примусове перетворення в UTF-8 для таких файлів, що може призвести до «подвійного кодування
UTF-8" (див. розділ нижче).

-- fixdouble
за допомогою параметра "--fixdouble" convmv перетворює лише ті файли, які залишаться
UTF-8 закодований після перетворення. Це корисно для виправлення файлів з подвійним кодуванням UTF-8.
Усі файли, які не є UTF-8 або не призведуть до UTF-8 після перетворення, не будуть
торкнувся. Також див. розділ «Як скасувати подвійний UTF-8 ...» нижче.

--тест
Потрібно перейменувати файли. За замовчуванням convmv просто друкує те, що хоче
робити.

--розбір
Це розширений варіант, який знайдуть люди, які хочуть написати інтерфейс графічного інтерфейсу
корисно (деякі інші, можливо, теж). Він змусить convmv роздрукувати, що він робитиме в файлі
простий спосіб розбору. Перший стовпець містить дію або якусь інформацію,
другий стовпець здебільшого містить файл, який потрібно змінити та за потреби
третій стовпець містить змінене значення. Кожен стовпець розділений символом \0\n
(нульбайт нового рядка). Кожен рядок (одна дія) відокремлюється символом \0\0\n (нульбайт нульбайт
новий рядок).

--no-preserve-mtimes
зміна назв файлів зазвичай призводить до оновлення mtime батьківського каталогу. Так як
версія 2 convmv за замовчуванням скидає mtime до старого значення. Якщо ваша файлова система
підтримує роздільну здатність до секунди, частина секунди часу і mtime буде втрачено
оскільки Perl ще не підтримує цього. За допомогою цієї опції можна забороняти збереження
з mtimes.

--замінити
якщо файл, який потрібно перейменувати, вже існує, він буде перезаписаний, якщо
інший вміст файлу однаковий.

-- втечу
ця опція видалить ці потворні % шістнадцяткові послідовності з імен файлів і перетворить їх на
(сподіваюся) приємніші 8-бітові символи. Після --unescape ви можете створити кодировку
перетворення. Такі послідовності, як %20 тощо, іноді утворюються під час завантаження через
http або ftp.

-- верхній , --нижчий
перетворити імена файлів у верхній чи нижній регістр. Якщо файл не закодований ASCII,
convmv очікує, що набір символів буде введений за допомогою перемикача -f.

--map=деяке-додаткове відображення
застосувати деякі спеціальні відображення символів, які зараз підтримуються:

ntfs-sfm(-undo), ntfs-sfu(-undo) для відображення незаконних символів ntfs для Linux
або клієнти Macintosh cifs (див. MS KB 117258 також параметр монтування mapchars для mount.cifs
на Linux).

ntfs-pretty(-undo) для зіставлення незаконних символів ntfs у цілком законні
Японські їх версії.

Див map_get_newname() функція, як легко додавати власні відображення, якщо потрібно. Дозволь мені
знайте, якщо ви думаєте, що в convmv тут не вистачає корисного зіставлення.

--дотлессі
піклуватися про проблему безкрапкового i/I. Версія «I» у нижньому регістрі також буде без крапки
тоді як версія "i" у верхньому регістрі також буде розставлена ​​крапками. Це питання турецької
та азербайджанці.

До речі: надрядкова крапка літери i була додана в середньовіччі до
відрізняти літеру (у рукописах) від сусідніх вертикальних штрихів у таких літерах
як u, m і n. J – це різновид форми i, яка з’явилася в цей час і пізніше
став окремим листом.

--допомога
роздрукувати короткий підсумок доступних опцій

--опції дампу
роздрукувати список усіх доступних опцій

ОПИС


convmv призначений для того, щоб допомогти конвертувати одне ім’я файлу, дерево каталогів і вміст, що міститься
файли або цілу файлову систему в інше кодування. Він просто перетворює імена файлів, а не
вміст файлів. Особливістю convmv є те, що він також піклується про
символічні посилання, також перетворює цільовий покажчик символічного посилання у випадку, якщо мета символічного посилання є
конвертований теж.

Все це дуже зручно, коли ви хочете перейти зі старих 8-бітових мов на UTF-8
місцевості. Також можна конвертувати каталоги в UTF-8, які вже частково
Кодування UTF-8. convmv може визначити, чи є певні файли закодованими UTF-8, і буде пропущено
їх за замовчуванням. Щоб вимкнути цю розумність, використовуйте перемикач «--nosmart».

Файлова система питання
Майже всі файлові системи POSIX не піклуються про те, як кодуються імена файлів, ось деякі
винятки:

HFS + on OS X / Дарвін

Linux та (більшість?) інших Unix-подібних операційних систем використовують так звану форму нормалізації C
(NFC) для його кодування UTF-8 за замовчуванням, але не дотримуйтесь цього. Дарвін, база с
ОС Macintosh забезпечує нормалізацію форми D (NFD), де кілька символів кодуються в
іншим способом. В OS X неможливо створити імена файлів NFC UTF-8, оскільки це є
заборонено на рівні файлової системи. У HFS+ імена файлів внутрішньо зберігаються в UTF-16 і коли
перетворюється назад на UTF-8, щоб базова система BSD була доступною, створюється NFD.
Читати http://developer.apple.com/qa/qa2001/qa1173.html за дефекти. Я думаю, що це було дуже
погана ідея і порушує багато речей під OS X, які очікують нормальної системи, що відповідає POSIX.
У будь-якому іншому місці convmv може конвертувати файли з NFC в NFD або навпаки, що робить
взаємодія з такими системами набагато простіше.

JFS

Якщо люди монтують розділи JFS з iocharset=utf8, виникає подібна проблема, тому що
JFS також призначений для внутрішнього зберігання імен файлів в UTF-16; це тому, що JFS Linux
насправді JFS2, який був переписаним JFS для OS/2. Розділи JFS повинні бути завжди
змонтовано за допомогою iocharset=iso8859-1, який також є стандартним для останніх ядер 2.6.6. Якщо
це не робиться, JFS не веде себе як файлова система POSIX, і це може статися
певні файли неможливо створити взагалі, наприклад, імена файлів у кодуванні ISO-8859-1. Тільки
коли потрібна взаємодія з OS/2, набір iocharset має бути встановлений відповідно до того, що ви використовуєте
місцевий charmap.

NFS4

Незважаючи на інші файлові системи POSIX, RFC3530 (NFS 4) вимагає UTF-8, але також говорить: "
Профіль nfs4_cs_prep не визначає форму нормалізації. Пізніший перегляд цього
специфікація може вказувати конкретну форму нормалізації." Іншими словами, якщо ви хочете
Використовуючи NFS4, ви можете знайти функції перетворення та нормалізації convmv дуже корисними.

FAT/VFAT та NTFS

NTFS і VFAT (для довгих імен файлів) внутрішньо використовують UTF-16 для зберігання імен файлів. Ти повинен
не потрібно конвертувати імена файлів, якщо ви змонтуєте одну з цих файлових систем. Використовуйте відповідне
натомість параметри монтування!

Як до анулювати подвійний UTF-8 (Або інший) кодований імена файлів
Іноді може статися так, що ви «подвійно закодували» певні імена файлів, наприклад, файл
імена файлів уже були закодовані UTF-8, і ви випадково зробили ще одне перетворення з деяких
кодування до UTF-8. Ви можете просто скасувати це, перетворивши це навпаки. The
from-charset має бути UTF-8, а to-charset має бути з набору символів, який ви раніше
випадково використаний. Якщо ви використовуєте параметр "--fixdouble", convmv переконається лише в цьому
будуть оброблені файли, які залишатимуться в кодуванні UTF-8 після перетворення, і це буде
залиште файли, відмінні від UTF-8, недоторканими. Ви повинні перевірити, щоб отримати правильні результати, виконавши
перетворення без "--notest" раніше, також параметр "--qfrom" може бути корисним, тому що
подвійні назви файлів utf-8 можуть зіпсувати ваш термінал, якщо вони друкуються - вони
часто містять послідовності керування, які роблять кумедні речі з вашим вікном терміналу. Якщо ви
не впевнені щодо кодування, з якого було випадково перетворено, використання «--qfrom» є a
хороший спосіб знайти необхідне кодування, не руйнуючи остаточно імена файлів.

Як до ремонт Самба файли
Якщо в smb.conf (для Samba 2.x) не встановлено правильний "набір символів"
змінної, файли, створені з клієнтів Win*, створюються в клієнті
кодова сторінка, наприклад cp850 для західноєвропейських мов. В результаті цього файли, які
містять символи, відмінні від ASCII, зламаються, якщо ви "ls" їх на сервері Unix. Якщо ви
змініть змінну "набір символів" на iso8859-1, щойно створені файли в порядку,
але старі файли все ще зіпсовані в кодуванні Windows. У цьому випадку convmv може
також використовуватися для перетворення старих файлів, спільних для Samba, із cp850 в iso8859-1.

До речі: Samba 3.x, нарешті, зіставляється з іменами файлів UTF-8 за замовчуванням, тому також під час міграції
з Samba 2 на Samba 3, можливо, доведеться конвертувати імена файлів.

Нетаталк сумісність питання
Коли Netatalk перемикається на UTF-8, який підтримується у версії 2, це НІ
достатньо, щоб перейменувати імена файлів. Треба зробити більше. Побачити
http://netatalk.sourceforge.net/2.0/htmldocs/upgrade.html#назви томів і файлів та
Утиліта uniconv Netatalk для отримання детальної інформації.

Використовуйте convmv онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

Команди Linux

Ad