Este é o comando mac2unix que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
dos2unix - conversor de formato de arquivo de texto de DOS / Mac para Unix e vice-versa
SINOPSE
dos2unix [opções] [ARQUIVO ...] [-n INFILE OUTFILE ...]
unix2dos [opções] [ARQUIVO ...] [-n INFILE OUTFILE ...]
DESCRIÇÃO
O pacote Dos2unix inclui utilitários "dos2unix" e "unix2dos" para converter texto simples
arquivos no formato DOS ou Mac para o formato Unix e vice-versa.
Em arquivos de texto DOS / Windows, uma quebra de linha, também conhecida como nova linha, é uma combinação de dois
caracteres: um retorno de carro (CR) seguido por um avanço de linha (LF). Em arquivos de texto Unix, uma linha
break é um único caractere: o Line Feed (LF). Em arquivos de texto do Mac, antes do Mac OS X, um
a quebra de linha era um único caractere de retorno de carro (CR). Hoje em dia o Mac OS usa o estilo Unix (LF)
quebras de linha.
Além das quebras de linha, Dos2unix também pode converter a codificação de arquivos. Algumas páginas de código DOS
pode ser convertido para Unix Latin-1. E os arquivos Windows Unicode (UTF-16) podem ser convertidos para
Arquivos Unix Unicode (UTF-8).
Os arquivos binários são ignorados automaticamente, a menos que a conversão seja forçada.
Arquivos não regulares, como diretórios e FIFOs, são automaticamente ignorados.
Links simbólicos e seus alvos são, por padrão, mantidos intocados. Links simbólicos podem
opcionalmente, pode ser substituído ou a saída pode ser gravada no destino do link simbólico.
Links simbólicos no Windows não são suportados. Links simbólicos do Windows sempre substituídos,
mantendo os alvos inalterados.
O Dos2unix foi modelado após o dos2unix sob SunOS / Solaris e tem modos de conversão semelhantes.
OPÇÕES
-- Trate todas as opções a seguir como nomes de arquivo. Use esta opção se você deseja converter
arquivos cujos nomes começam com um travessão. Por exemplo, para converter um arquivo chamado "-foo", você
pode usar este comando:
dos2unix - -foo
Ou no novo modo de arquivo:
dos2unix -n - -foo out.txt
-ascii
Converta apenas quebras de linha. Este é o modo de conversão padrão.
-iso
Conversão entre o conjunto de caracteres DOS e ISO-8859-1. Veja também a seção CONVERSÃO
MODOS.
-1252
Use a página de código 1252 do Windows (Europa Ocidental).
-437
Use a página de código 437 do DOS (EUA). Esta é a página de código padrão usada para conversão ISO.
-850
Use a página de código 850 do DOS (Europa Ocidental).
-860
Use a página de código 860 do DOS (português).
-863
Use a página de código 863 do DOS (francês do Canadá).
-865
Use a página de código 865 do DOS (nórdico).
-7 Converta caracteres de 8 bits em espaço de 7 bits.
-c, --convmode CONVMODE
Defina o modo de conversão. Onde CONVMODE é um dos: ascii, 7bit, iso, mac com ascii sendo
o padrão.
-f, --força
Força a conversão de arquivos binários.
-h, --Socorro
Exibir ajuda e sair.
-k, --manter data
Mantenha o carimbo de data do arquivo de saída igual ao do arquivo de entrada.
-EU, --licença
Licença do programa de exibição.
-eu, --nova linha
Adicionar nova linha adicional.
dos2unix: Apenas as quebras de linha do DOS são alteradas para duas quebras de linha do Unix. Somente no modo Mac
As quebras de linha do Mac são alteradas para duas quebras de linha do Unix.
unix2dos: Apenas as quebras de linha Unix são alteradas para duas quebras de linha DOS. No modo Mac Unix
quebras de linha são alteradas para duas quebras de linha Mac.
-m, --add-bom
Grave uma Marca de Ordem de Byte UTF-8 no arquivo de saída. Nunca use esta opção quando o
a codificação de saída é diferente de UTF-8. Consulte também a seção UNICODE.
-n, --novo arquivo NO ARQUIVO ARQUIVO ...
Novo modo de arquivo. Converta o arquivo INFILE e grave a saída no arquivo OUTFILE. Os nomes dos arquivos devem
ser dado em pares e nomes curinga devem não ser usado ou você precisarão perder seus arquivos.
A pessoa que inicia a conversão no modo de novo arquivo (pareado) será o dono do
o arquivo convertido. As permissões de leitura / gravação do novo arquivo serão as permissões
do arquivo original menos o umask(1) da pessoa que dirige a conversão.
-ó, --arquivo antigo ARQUIVO ...
Modo de arquivo antigo. Converta o arquivo FILE e sobrescreva a saída nele. O padrão do programa é
executado neste modo. Nomes curinga podem ser usados.
No modo de arquivo antigo (no local), o arquivo convertido obtém o mesmo proprietário, grupo e
permissões de leitura / gravação como o arquivo original. Além disso, quando o arquivo é convertido por
outro usuário que possui permissões de gravação no arquivo (por exemplo, usuário root). A conversão
será abortado quando não for possível preservar os valores originais. Mudança de
proprietário pode significar que o proprietário original não consegue mais ler o arquivo. Mudar
do grupo pode ser um risco à segurança, o arquivo pode ser legível para pessoas por
a quem não se destina. A preservação das permissões de proprietário, grupo e leitura / gravação é
suportado apenas em Unix.
-q, --quieto
Modo silencioso. Suprima todos os avisos e mensagens. O valor de retorno é zero. Exceto quando
opções de linha de comando incorretas são usadas.
-sim, --seguro
Ignorar arquivos binários (padrão).
CPC, --assume-utf16le
Suponha que o formato do arquivo de entrada seja UTF-16LE.
Quando há uma Marca de Ordem de Byte no arquivo de entrada, o BOM tem prioridade sobre este
opção.
Quando você fez uma suposição errada (o arquivo de entrada não estava no formato UTF-16LE) e o
a conversão for bem-sucedida, você obterá um arquivo de saída UTF-8 com o texto incorreto. Você pode desfazer
a conversão errada com iconv(1) convertendo o arquivo de saída UTF-8 de volta para
UTF-16LE. Isso trará de volta o arquivo original.
O pressuposto de UTF-16LE funciona como um conversão modo. Mudando para o padrão
ascii modo, a suposição UTF-16LE está desligada.
-ub, --assume-utf16be
Suponha que o formato do arquivo de entrada seja UTF-16BE.
Esta opção funciona da mesma forma que a opção "-ul".
-F, --follow-link simbólico
Siga os links simbólicos e converta os alvos.
-R, --replace-link simbólico
Substitua os links simbólicos por arquivos convertidos (os arquivos de destino originais permanecem inalterados).
-S, --skip-link simbólico
Mantenha links simbólicos e destinos inalterados (padrão).
-V, --versão
Exibir informações da versão e sair.
MAC MODA
No modo normal, as quebras de linha são convertidas de DOS para Unix e vice-versa. Quebras de linha do Mac
não são convertidos.
No modo Mac, as quebras de linha são convertidas de Mac para Unix e vice-versa. As quebras de linha do DOS são
Não mudou.
Para executar no modo Mac, use a opção de linha de comando "-c mac" ou use os comandos "mac2unix" ou
"unix2mac".
CONVERSÃO MODOS
Modos de conversão ascii, 7bit e iso são semelhantes aos de dos2unix / unix2dos em
SunOS / Solaris.
ascii
No modo "ascii", apenas as quebras de linha são convertidas. Este é o modo de conversão padrão.
Embora o nome deste modo seja ASCII, que é um padrão de 7 bits, o modo real é
8 bits. Use sempre este modo ao converter arquivos Unicode UTF-8.
7bit
Neste modo, todos os caracteres não ASCII de 8 bits (com valores de 128 a 255) são
convertido para um espaço de 7 bits.
iso Os caracteres são convertidos entre um conjunto de caracteres DOS (página de código) e um conjunto de caracteres ISO
ISO-8859-1 (Latin-1) no Unix. Caracteres DOS sem equivalente ISO-8859-1, para os quais
a conversão não é possível, são convertidos em um ponto. A mesma conta para ISO-8859-1
caracteres sem contrapartida DOS.
Quando apenas a opção "-iso" é usada, dos2unix tentará determinar a página de código ativa.
Quando isso não for possível, dos2unix usará a página de código padrão CP437, que é principalmente
usado nos EUA. Para forçar uma página de código específica, use as opções "-437" (EUA), "-850"
(Europa Ocidental), "-860" (português), "-863" (francês canadense) ou "-865" (nórdico).
A página de código CP1252 do Windows (Europa Ocidental) também é compatível com a opção "-1252". Para
outras páginas de código usam dos2unix em combinação com iconv(1). Iconv pode converter entre
uma longa lista de codificações de caracteres.
Nunca use a conversão ISO em arquivos de texto Unicode. Isso corromperá os arquivos codificados em UTF-8.
Alguns exemplos:
Converter da página de código padrão do DOS para Unix Latin-1
dos2unix -iso -n entrada.txt saída.txt
Converter de DOS CP850 para Unix Latin-1
dos2unix -850 -n entrada.txt saída.txt
Converter do Windows CP1252 para Unix Latin-1
dos2unix -1252 -n entrada.txt saída.txt
Converter do Windows CP1252 para Unix UTF-8 (Unicode)
iconv -f CP1252 -t UTF-8 in.txt | dos2unix> out.txt
Converta de Unix Latin-1 para a página de código padrão do DOS.
unix2dos -iso -n entrada.txt saída.txt
Converter de Unix Latin-1 para DOS CP850
unix2dos -850 -n entrada.txt saída.txt
Converter de Unix Latin-1 para Windows CP1252
unix2dos -1252 -n entrada.txt saída.txt
Converter de Unix UTF-8 (Unicode) para Windows CP1252
unix2dos <in.txt | iconv -f UTF-8 -t CP1252> out.txt
Veja tambémhttp://czyborra.com/charsets/codepages.html> e
<http://czyborra.com/charsets/iso8859.html>.
UNICODE
Codificações
Existem diferentes codificações Unicode. No Unix e no Linux, os arquivos Unicode são tipicamente
codificado na codificação UTF-8. No Windows Unicode, os arquivos de texto podem ser codificados em UTF-8, UTF-16,
ou UTF-16 big endian, mas são codificados principalmente no formato UTF-16.
Conversão
Os arquivos de texto Unicode podem ter quebras de linha DOS, Unix ou Mac, como arquivos de texto normais.
Todas as versões de dos2unix e unix2dos podem converter arquivos codificados em UTF-8, porque UTF-8 era
projetado para compatibilidade com versões anteriores com ASCII.
Dos2unix e unix2dos com suporte Unicode UTF-16, pode ler little e big endian UTF-16
arquivos de texto codificados. Para ver se o dos2unix foi construído com suporte a UTF-16, digite "dos2unix -V".
As versões Windows do dos2unix e unix2dos convertem arquivos codificados em UTF-16 sempre para UTF-8
arquivos codificados. Versões Unix de dos2unix / unix2dos convertem arquivos codificados em UTF-16 para o
codificação de caracteres de localidade quando definida como UTF-8. Use o local(1) comando para descobrir
qual é a codificação de caractere local.
Como os arquivos de texto formatados em UTF-8 são bem suportados no Windows e no Unix, dos2unix
e o unix2dos não tem opção para gravar arquivos UTF-16. Todos os caracteres UTF-16 podem ser codificados em
UTF-8. A conversão de UTF-16 em UTF-8 ocorre sem perdas. Os arquivos UTF-16 serão ignorados
Unix quando a codificação de caracteres de local não é UTF-8, para evitar a perda acidental de texto.
Quando ocorre um erro de conversão de UTF-16 em UTF-8, por exemplo, quando o arquivo de entrada UTF-16
contém um erro, o arquivo será ignorado.
A conversão de modo ISO e de 7 bits não funciona em arquivos UTF-16.
Byte Encomenda Mark
No Windows, os arquivos de texto Unicode geralmente têm uma marca de ordem de bytes (BOM), porque muitos
programas (incluindo o Bloco de notas) adicionam BOMs por padrão. Veja também
<http://en.wikipedia.org/wiki/Byte_order_mark>.
No Unix, os arquivos Unicode normalmente não têm um BOM. Presume-se que os arquivos de texto são
codificado na codificação de caracteres de localidade.
Dos2unix só pode detectar se um arquivo está no formato UTF-16 se o arquivo tiver um BOM. Quando um
O arquivo UTF-16 não tem um BOM, dos2unix verá o arquivo como um arquivo binário.
Use a opção "-ul" ou "-ub" para converter um arquivo UTF-16 sem BOM.
Dos2unix nunca grava um BOM no arquivo de saída, a menos que você use a opção "-m".
Unix2dos grava um BOM no arquivo de saída quando o arquivo de entrada tem um BOM, ou quando a opção
"-m" é usado.
Unicode exemplos
Converter do Windows UTF-16 (com BOM) para Unix UTF-8
dos2unix -n entrada.txt saída.txt
Converter do Windows UTF-16LE (sem BOM) para Unix UTF-8
dos2unix -ul -n entrada.txt saída.txt
Converter de Unix UTF-8 para Windows UTF-8 com BOM
unix2dos -m -n entrada.txt saída.txt
Converter de Unix UTF-8 para Windows UTF-16
unix2dos <in.txt | iconv -f UTF-8 -t UTF-16> out.txt
EXEMPLOS
Leia a entrada de 'stdin' e grave a saída em 'stdout'.
dos2unix
dos2unix -l -cmac
Converta e substitua a.txt. Converta e substitua b.txt.
dos2unix a.txt b.txt
dos2unix -o a.txt b.txt
Converta e substitua a.txt no modo de conversão ASCII.
dos2unix a.txt
Converta e substitua a.txt no modo de conversão ASCII. Converter e substituir b.txt em 7 bits
modo de conversão.
dos2unix a.txt -c 7 bits b.txt
dos2unix -c ascii a.txt -c 7 bits b.txt
dos2unix -ascii a.txt -7 b.txt
Converta um.txt do formato Mac para o Unix.
dos2unix -c mac a.txt
mac2unix a.txt
Converta um.txt do formato Unix para o Mac.
unix2dos -c mac a.txt
unix2mac a.txt
Converta e substitua a.txt, mantendo o carimbo de data original.
dos2unix -k a.txt
dos2unix -k -o a.txt
Converta a.txt e escreva para e.txt.
dos2unix -n a.txt e.txt
Converta a.txt e escreva para e.txt, mantenha o carimbo de data de e.txt igual a a.txt.
dos2unix -k -na.txt e.txt
Converta e substitua a.txt. Converta b.txt e escreva em e.txt.
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
Converta c.txt e grave em e.txt. Converta e substitua a.txt. Converta e substitua b.txt.
Converta d.txt e grave em f.txt.
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
RECURSIVO CONVERSÃO
Use dos2unix em combinação com o find(1) e xargs(1) comandos para converter recursivamente
arquivos de texto em uma estrutura de árvore de diretório. Por exemplo, para converter todos os arquivos .txt no
árvore de diretórios sob o tipo de diretório atual:
achar . -name * .txt | xargs dos2unix
LOCALIZAÇÃO
GRANDE
O idioma principal é selecionado com a variável de ambiente LANG. A variável LANG
consiste em várias partes. A primeira parte contém em letras minúsculas o código do idioma.
O segundo é opcional e é o código do país em letras maiúsculas, precedido por um
sublinhado. Há também uma terceira parte opcional: codificação de caracteres, precedida por um
ponto. Alguns exemplos para shells do tipo padrão POSIX:
export LANG = nl holandês
export LANG = nl_NL holandês, Holanda
export LANG = nl_BE holandês, Bélgica
export LANG = es_ES Espanhol, Espanha
export LANG = es_MX Espanhol, México
export LANG = en_US.iso88591 Inglês, EUA, codificação Latin-1
export LANG = en_GB.UTF-8 Inglês, Reino Unido, codificação UTF-8
Para uma lista completa de códigos de idioma e país, consulte o manual gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html# Language-Codes>
Em sistemas Unix você pode usar para comandar local(1) para obter informações específicas do local.
IDIOMA
Com a variável de ambiente LANGUAGE, você pode especificar uma lista de prioridades de idiomas,
separados por dois pontos. Dos2unix dá preferência a LANGUAGE em vez de LANG. Por exemplo,
primeiro holandês e depois alemão: "LANGUAGE = nl: de". Você deve primeiro habilitar a localização,
definindo LANG (ou LC_ALL) com um valor diferente de "C", antes de usar um idioma
lista de prioridades por meio da variável LANGUAGE. Veja também o manual gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html# The-LANGUAGE-variable>
Se você selecionar um idioma que não está disponível, você obterá o inglês padrão
mensagens.
DOS2UNIX_LOCALEDIR
Com a variável de ambiente DOS2UNIX_LOCALEDIR o LOCALEDIR definido durante a compilação
pode ser anulado. LOCALEDIR é usado para encontrar os arquivos de idioma. O valor padrão GNU
é "/ usr / local / share / locale". Opção --versão irá exibir o LOCALEDIR que é
usava.
Exemplo (shell POSIX):
export DOS2UNIX_LOCALEDIR = $ HOME / share / locale
RETORNO VALOR
Em caso de sucesso, zero é retornado. Quando ocorre um erro do sistema, o último erro do sistema será
retornou. Para outros erros, 1 é retornado.
O valor de retorno é sempre zero no modo silencioso, exceto quando as opções de linha de comando erradas são
usava.
PADRÕES
<http://en.wikipedia.org/wiki/Text_file>
<http://en.wikipedia.org/wiki/Carriage_return>
<http://en.wikipedia.org/wiki/Newline>
<http://en.wikipedia.org/wiki/Unicode>
AUTORES
Benjamin Lin -[email protegido]> Bernd Johannes Wuebben (modo mac2unix) -
<[email protegido]>, Christian Wurll (adicionar nova linha extra) -[email protegido]>, Erwin
Waterlander -[email protegido]> (Mantenedor)
Página do projeto:http://waterlan.home.xs4all.nl/dos2unix.html>
Página SourceForge:http://sourceforge.net/projects/dos2unix/>
Freecode:http://freecode.com/projects/dos2unix>
Use mac2unix online usando serviços onworks.net