t2html - On-line na nuvem

Este é o comando t2html que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas múltiplas estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online de Windows ou emulador online de MAC OS.

PROGRAMA:

NOME


t2html - Conversor de texto simples para HTML. Depende de regras de recuo de texto.

SINOPSE


t2html [opções] arquivo.txt > arquivo.html

DESCRIÇÃO


Converta arquivos de texto puro em páginas HTML de boa aparência, possivelmente emolduradas. Um exemplo de
conversão:

1. Código-fonte de texto simples
http://pm-doc.git.sourceforge.net/git/gitweb.cgi?p=pm-doc/pm-doc;a=blob_plain;f=doc/index.txt;hb=HEAD

2. resultado da conversão com a opção --css-file personalizada:
http://pm-doc.sourceforge.net/pm-tips.html
http://pm-doc.sourceforge.net/pm-tips.css

3. Um modo Emacs tinytf.el para escrever os arquivos de texto (opcional)
https://savannah.nongnu.org/projects/emacs-tiny-tools

Requisitos for da entrada ascii arquivos

O arquivo deverá ser escrito em Formato Técnico, cujo layout está descrito neste
manual. Basicamente a ideia é simples e existem apenas dois níveis de título: um na coluna 0
e o outro na coluna 4 (a meio caminho entre a largura da guia). O texto padrão começa na coluna
8 (a posição após a tecla tab pressionada).

A ideia do formato técnico é que cada coluna represente um layout de renderização diferente em
o HTML gerado. Não há marcação especial necessária no arquivo de texto, então você pode usar o
versão de texto como uma cópia mestre de um FAQ etc. Marcadores, listas numeradas, ênfase nas palavras e
cotação etc. pode ser expressa de forma natural.

HTML descrição

O HTML gerado inclui Cascading Style Sheet 2 (CSS2) incorporado e um pequeno pedaço de
Código Java. O CSS2 é usado para colorir o layout da página e definir a impressão adequada
tamanhos de fonte. O HTML gerado também adota uma abordagem para suportar XHTML. Ver página
http://www.w3.org/TR/xhtml1/#guidelines onde estão as recomendações de compatibilidade com versões anteriores
estão delineados:

HTML legal XHTML requer
..



XHTML não suporta identificadores de fragmento #foo, com o elemento "nome", mas usa "id"
em vez de. Para compatibilidade com versões anteriores, ambos os elementos são definidos:

< ..name="tag"> Agora é <.. name="tag" id="tag">

NOTA: Este programa nunca foi projetado para ser usado para XHTML e a validade estrita do XHTML
não é esperado.

Motivação

O formato mais fácil para escrever documentos grandes, como FAQs, é o texto. Um arquivo de texto oferece
Edição WysiWyg e pode ser facilmente transformado em formato HTML. Arquivos de texto são facilmente
mantido e não há requisitos para editores de texto especiais. Qualquer editor de texto como
notepad, vi, Emacs podem ser usados ​​para manter os documentos.

Arquivos de texto também são o único formato sensato se os documentos forem mantidos sob controle de versão
como RCS, CVS, SVN, Arch, Perforce, ClearCase. Eles podem ser facilmente comparados com diff e
patches podem ser facilmente recebidos e enviados para eles.

Para ajudar na manutenção de documentos grandes, também está disponível um Emacs modo menor, pacote
chamado tinytf.el, que oferece fonte de texto com cores, controle de recuo, marcadores
preenchimento, renumeração de títulos, marcação de palavras, destaque de sintaxe etc. Ver projeto
http://freshmeat.net/projects/emacs-tiny-tools

OPÇÕES


HTML: cabeçalho e Rodapé opções
--como é
Qualquer formatação HTML extra ou manipulação de texto é suprimida. O texto é preservado como
aparece no arquivo. Use esta opção se você planeja entregar ou imprimir o texto como visto.

o Se o arquivo contiver "Índice", ele não será removido
o O bloco de índice não foi criado (normalmente seria)

--autor -a STR
Autor do documento, por exemplo --autor "João Corça"

--arquivo de isenção de responsabilidade ARQUIVO
O texto que aparece no rodapé é lido neste arquivo. Se não for dado o padrão
texto de direitos autorais é adicionado. As opções "--quiet" e "--simple" suprimem isenções de responsabilidade.

--documento ARQUIVO
Nome do documento ou nome do arquivo. Você poderia listar todos os URLs alternativos para o documento
com esta opção.

--o email -e EMAIL
O endereço de contato do autor do documento. Deve ser um endereço de e-mail puro, sem
Caracteres "<" e ">" incluídos. Por exemplo. --o email foo@exemplo.com

--e-mail "eu@here.com>" ERRADO
--e-mail "eu@here.com" certo

--simples -s
Imprimir apenas rodapé mínimo: contato, email e data. Use "--quiet" para completamente
descartar rodapé.

--t2html-tags
Permitir processamento incorporado #T2HTML- diretivas dentro do arquivo. Veja a explicação completa
lendo o tópico "DIRETIVAS INCORPORADAS NO TEXTO". Por padrão, você não precisa
forneça esta opção - ela está "ativada" por padrão.

Para desconsiderar as diretivas incorporadas no arquivo de texto, forneça a opção "no": --not2html-tags.

--título STR -t STR
O texto do título que aparece no quadro superior do navegador.

--url URL

Localização do arquivo HTML. Quando --documento deu o nome, isso dá a localização. Esse
as informações estão impressas no rodapé.

HTML: Navegação URLs
--base URL
Localização do URL do arquivo HTML no destino local onde será disponibilizado.
Esta opção é necessária apenas se o documento estiver hospedado em um servidor FTP (raro, mas
possível). Um documento baseado em servidor FTP não pode usar links de índice (fragmento
#marcação identificadores), a menos que a tag HTML BASE também esteja definida.

O argumento pode ser o URL completo do documento:

--base ftp://ftp.example.com/file.html
--base ftp://ftp.example.com/

--botão-título-topo
Adicionar adicional [toc] botão de navegação ao final de cada título. Isso pode ser útil
em arquivos HTML longos e sem moldura.

--botão superior URL
Os botões são colocados na parte superior do documento em ordem: [anterior][topo][próximo] e
--botão-* opções definem os URLs.

Se URL for string Nenhum então nenhum botão será inserido. Isto pode ser útil se os botões estiverem
definido por um programa separado. E exemplo usando Perl:

#!/ usr / bin / perl

meu $top = "index.html"; # definir padrões
meu $prev = "nenhum";
meu $próximo = "nenhum";

# ... em algum lugar $prev ou $next pode ser definido ou não

qx(t2html --button-top "$top" --button-prev "$prev" --button-next "$next" ...);

# Fim do programa exemplo

--botão-anterior URL
URL para ir para o documento ou string anterior Nenhum.

--botão-próximo URL
URL para ir para o próximo documento ou string Nenhum.

--referência tag = valor
Você pode adicionar quaisquer referências personalizadas (tags) dentro do texto e expandi-las para qualquer valor.
Esta opção pode ser dada múltiplas vezes e cada ocorrência de TAG é substituída por
VALOR. Por exemplo, quando fornecidas as seguintes opções:

--referência "#HOME-URL=http://www.example.com/dir"
--reference "#ARQUIVO-URL=http://www.example.com/dir/dir2"

Quando referenciado em texto, o HTML gerado inclui valores expandidos e expandidos. Um
texto de exemplo:

A página inicial é #HOME-URL/page.html e a página espelhada está em
#ARCHIVE-URL/page.html onde você pode encontrar a versão mais recente.

-R, --separador de referência STRING
Veja acima. String que é usada para dividir TAG e VALUE. O padrão é o sinal de igual "=".

-T, --toc-url-imprimir
URLs de visualização (construídos a partir de títulos) que compõem o Índice (NOME
Tags AHREF) em um documento. A lista é enviada para stderr, para que possa ser
separados:

% t2html --toc-url-print tmp.txt > arquivo.html 2> toc-list.txt

Onde você precisaria disso? Se você quiser saber a identificação do fragmento do seu arquivo,
você precisa da lista de nomes.

http://www.example.com/myfile.html# identificador de fragmento

HTML: Controlador APF geração (HTML tabelas)
--css-código-bg
Esta opção afeta como a seção de código (coluna 12) é renderizada. Normalmente a seção
está cercado por um .. códigos, mas com essas opções, algo mais
mais sofisticado é usado. O código está encapsulado dentro de um ... e o fundo
a cor está definida para um tom de cinza.

--css-código-nota "REGEXP"
Opção --css-código-bg é necessário para ativar esta opção. Uma palavra especial definida usando
regexp (o padrão é 'Nota:') marcará seções de código especialmente. A “primeira palavra” é
comparado com o regexp Perl fornecido.

A regexp fornecida não deve, repito, não deve incluir quaisquer operadores de grupo correspondentes.
Isso significa simplesmente que parênteses de agrupamento como "(um|dois|três)" não são permitidos.
Você deve usar os que não são de agrupamento Perl, como "(?:um|dois|três)". Por favor consulte perl
página de manual [perlre] se esta breve introdução não forneceu corda suficiente.

Com esta opção, em vez de renderizar o texto da coluna 12 com .. , o texto
aparece como texto normal, mas com uma diferença. A cor de fundo do texto tem
foi alterado para cinza mais escuro para se destacar visualmente do texto.

Um exemplo esclarecerá. Suponha que você passou opções --css-código-bg e
--css-code-note='(?:Aviso|Nota):', que instruiu a tratar os primeiros parágrafos em
coluna 12 de forma diferente. Assim:

Este é o texto normal que aparece em algum lugar na coluna 8.
Pode conter várias linhas de texto neste parágrafo.

Aviso: Aqui está a seção especial, na coluna 12,
e a primeira palavra neste parágrafo é 'Aviso:'.
Só isso torna este parágrafo da coluna 12 especial.

Agora, temos algum código para mostrar ao usuário:

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Uma nota, texto escrito com palavra especial inicial, como "Aviso:", deve caber em um
pragrafo completo. Quaisquer outros parágrafos a seguir são renderizados como seções de código. Como
aqui:

Este é o texto normal que aparece em algum lugar
Pode conter várias linhas de texto neste parágrafo

Aviso: Aqui está a seção especial, na coluna 12,
e a primeira palavra neste parágrafo é 'Aviso:'
o que o torna especial

No entanto, este parágrafo NÃO É renderizado especialmente
não mais. Apenas o primeiro parágrafo acima.

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Como se isso não bastasse, existem algumas diretivas especiais de controle de tabela que permitem
você controla o .. que é colocado ao redor da seção de código na coluna 12.
Aqui estão alguns exemplos:

Aqui está o exemplo 1

#t2html::td:bgcolor=#F7F7DE

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Aqui está o exemplo 2

#t2html::td:bgcolor=#F7F7DE:tableborder:1

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Aqui está o exemplo 3

#t2html::td:bgcolor="#FFFFFF":tableclass:tracejado

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Aqui está o exemplo 4

#t2html::td:bgcolor="#FFFFFF":table:border=1_width=94%_border=0_cellpadding="10"_cellspacing="0"

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Parece enigmático? Não posso evitar isso e para que você entenda completamente o que
essas diretivas fazem, você precisa entender quais elementos podem ser adicionados ao
e fichas. Consulte a especificação HTML para obter os atributos disponíveis. Aqui está
informando o que você pode fazer:

O comando de início é:

#t2html::
|
Depois disso, vêm os pares de atributos no formato chave: valor
e vários como key1:value1:key2:value2 ...

Os pares "chave:valor" podem ser:

td:ATRIBUTOS
|
Isto é convertido em

tabela: ATRIBUTOS
|
Isto é convertido em

Não poderá haver espaços nos ATRIBUTOS, pois a “Primeira Palavra” deverá ser uma
palavra contígua. Um sublinhado pode ser usado no lugar do espaço:

tabela:borda=1_largura=94%
|
Interpretado como

Também é possível alterar o estilo CLASS padrão com a palavra "tableclass". Em ordem
o CLASS para ser útil, suas definições CSS devem estar no padrão
configuração ou fornecido a partir de um arquivo externo. Ver opção --Arquivo de script.

classe de tabela:nome
|
Interpretado como

Por exemplo, existem alguns estilos padrão que podem ser usados:

1) Aqui está o exemplo CLASS "tracejado"

#t2html::tableclass:tracejado

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

2) Aqui está um exemplo "sólido" da CLASSE:

#t2html::tableclass:solid

para (eu = 0; eu++; eu < 10)
{
// Fazendo algo neste loop
}

Você pode alterar qualquer valor individual da definição de tabela padrão, que é:



Para alterar, por exemplo, apenas o valor do cellpadding, você diria:

#t2html::tabela:tablecellpadding:2

Se você não tiver certeza do que se trata, simplesmente execute o programa com --página de teste
e observe a origem e os arquivos HTML gerados. Isso deveria oferecer mais corda para
Experimente com.

--arquivo-css ARQUIVO
Incluir que se refere à fonte externa de definição de estilo CSS. Esta opção
é ignorado se --Arquivo de script opção foi dada, porque essa opção importa inteiros
conteúdo dentro da tag HEAD. Esta opção pode aparecer várias vezes e o CSS externo
os arquivos são adicionados na ordem listada.

--css-tipo de fonte DEFINIÇÃO CSS
Defina a definição de fonte do elemento BODY como CSS-DEFINITION. O valor padrão usado é o
composição tipográfica regular usada em jornais e livros:

--css-font-type='font-family: "Times New Roman", serif;'

--css-tamanho da fonte DEFINIÇÃO CSS
Defina o tamanho da fonte do elemento body para CSS-DEFINITION. O tamanho da fonte padrão é expresso
em pontos:

--css-font-size="tamanho da fonte: 12pt;"

HTML: Controlador da corpo of documento
--excluir REGEXP
Exclua as linhas correspondentes ao REGEXP perl. Isto é útil se você usar alguma ferramenta de documento que
usa tags de navegação no arquivo de texto que você não deseja que apareça no gerado
Html

--delete-email-headers
Exclua os cabeçalhos de e-mail no início do arquivo, até a primeira linha vazia que inicia o
corpo. Se você mantiver seu documento pronto para publicação de notícias na Usenet, ele poderá conter
cabeçalhos e corpo:

De: ...
Grupos de notícias: ...
Informações do remetente X:
Resumo:

CORPO DO TEXTO

--nodelete-default
Use esta opção para suprimir a exclusão de texto padrão (que está ativada).

O pacote "folding.el" do Emacs e o vi podem ser usados ​​com qualquer texto ou linguagem de programação para
coloque seções de texto entre tags {{{ e }}}. Você pode abrir ou fechar essas dobras.
Isso permite manter documentos grandes em ordem e gerenciáveis ​​com bastante facilidade. Para Emacs
apoio, veja. ftp://ftp.csd.uu.se/pub/users/andersl/beta/

O valor padrão exclui esses marcadores e comentários especiais "#_comment" que o tornam
possível incluir suas próprias notas que não estão incluídas na saída gerada.

{{{Seção de segurança

#_comment Certifique-se de revisar esta seção para
#_comentar o próximo lançamento

A segurança é uma questão importante no dia a dia da administração...
Mais texto...

}}}

--html-corpo STR
Atributos adicionais para adicionar à tag HTML . Você poderia, por exemplo, definir o idioma do
texto com --html-corpo LANG=pt que geraria tag HTML Ver
seção "VEJA TAMBÉM" para ISO 639.

--html-column-beg="SPEC HTML-SPEC"
A interpretação padrão das colunas 1,2,3 5,6,7,8,9,10,11,12 pode ser alterada com
mendigar e final muda. As colunas 0,4 não podem ser alteradas porque estão reservadas para
títulos. Aqui estão alguns exemplos:

--html-column-beg="7citação "
--html-column-end="7quote"

--html-coluna-beg="10 classe='coluna10'"
--html-column-end="10 "

--html-column-beg="citação "
--html-column-end="citação"

Nota: Você só pode fornecer especificações até a coluna 12. Se o texto estiver além da coluna
12, é interpretado como na coluna 12.

Além do número da coluna, o SPEC também pode ser uma das seguintes strings

Especificação de marcação de palavra equivalente
------------------------------
citação `'
audacioso _
emp *
pequeno +
grande =
ref [] como: [Michael] referido a [rfc822]

Outras especificações disponíveis
------------------------------
7quote Quando a coluna 7 começa com aspas duplas.

Para valores de folha de estilo para cada cor, consulte classe atributo e uso --Arquivo de script
opção para importar definições. Normalmente /usr/lib/X11/rgb.txt lista possíveis valores de cores
e o padrão HTML em http://www.w3.org/ define as seguintes cores nomeadas padrão:

Preto #000000 Marrom #800000
Verde #008000 Marinho #000080
Prata #C0C0C0 Vermelho #FF0000
Lima #00FF00 Azul #0000FF
Cinza #808080 Roxo #800080
Azeitona #808000 Azul-petróleo #008080
Branco #FFFFFF Fúcsia #FF00FF
Amarelo #FFFF00 Aqua #00FFFF

--html-column-end="COL HTML-SPEC"
See --html-coluna-beg

--html-fonte TAMANHO
Defina TAMANHO DA FONTE. Pode ser útil definir um tamanho de fonte maior para apresentações.

-F, --html-quadro [QUADRO-PARÂMETROS]
Se fornecido, três arquivos HTML separados serão gerados. O quadro esquerdo conterá
O TOC e o quadro direito contêm o resto do texto. O QUADRO-PARÂMETROS pode ser qualquer válido
parâmetros para tag HTML FRAMESET. O padrão é "cols="25%,75%"".

Usar isso implica --Fora opção automaticamente, porque três arquivos não podem ser impressos
para stdout.

arquivo.html

-> file.html O arquivo Frame, aponte o navegador aqui
file-toc.html Quadro esquerdo (navegação)
file-body.html Quadro direito (conteúdo)

--língua ID
Use o ID do idioma, um identificador ISO de dois caracteres como "en" para inglês durante o
geração de HTML. Isso afeta apenas o texto mostrado ao usuário final, como texto
"Índice". A configuração padrão é "en". Consulte a seção "VEJA TAMBÉM" para padrões
ISO 639 e ISO 3166 para códigos adequados.

O idioma selecionado altera os arrays internos do propgrama de duas maneiras: 1) Em vez de
padrão "Tabela de conteúdos" no cabeçalho o equivalente no idioma nacional será usado 2)
O texto "Pic" abaixo das imagens incorporadas numeradas sequencialmente usará natinal
equivalente.

Se o seu idioma não for suportado, envie a frase para "Índice" e
palavra "Pic" em seu idioma para o mantenedor.

--Arquivo de script ARQUIVO
Incluir código java que deve estar completo De arquivo. O código é
ponha dentro de cada HTML.

O --Arquivo de script é uma maneira geral de importar qualquer coisa para o elemento HEAD. Por exemplo. Se
você deseja manter definições de estilo separadas para todos, você só pode importar um ponteiro
para uma folha de estilo. Ver 14.3.2 Especificando externo estilo folhas no padrão HTML 4.0.

--meta-palavras-chave STR
Meta palavras-chave. Usado por motores de busca. Separe palavras-chave como "AA, BB, CC" com
vírgulas. Consulte a especificação HTML 4.01 e o tópico "7.4.4 Metadados" e veja
http://www.htmlhelp.com/reference/wilbur/ e

--meta-palavras-chave "AA, BB, CC"

--Meta Descrição STR
Meta Descrição. Inclui string de descrição, máximo de 1000 caracteres. Isto é usado por
motores de busca. Consulte a especificação HTML 4.01 e o tópico "7.4.4 Metadados"

--nome-uniq
As primeiras 1 a 4 palavras do título são usadas para o HTML nome Tag. No entanto, é
possível que dois títulos iguais comecem exatamente com as mesmas 1 a 4 palavras. Nesses casos
você tem que ativar esta opção. Ele usará o contador 00 - 999 em vez das palavras de
títulos para construir HTML nome referências.

Utilize esta opção apenas em emergências, pois referindo-se ao bloco de salto nome via

httpI://example.com/doc.html#header_name

é mais conveniente do que usar referência obscura

httpI://example.com/doc.html#11

Além disso, cada vez que você adiciona um novo título, o número muda, enquanto o símbolo
o nome escolhido no título permanece enquanto você não alterar o título. Pense sobre
bem-estar de seus internautas que marcam suas páginas. Tente fazer títulos para não ter
mesmos assuntos e você não precisa desta opção.

ISO manutenção e fornada trabalho comandos
-UMA, --detecção automática
Converta o arquivo somente se a tag "#T2HTML-" for encontrada no arquivo. Esta opção é útil se você
execute um comando em lote para converter todos os arquivos em HTML, mas apenas se eles se parecerem com HTML base
arquivos:

encontrar . -nome "*.txt" -tipo f
-exec t2html --auto-detectar --verbose --out {} \;

O comando pesquisa todos os arquivos *.txt no diretório atual e os alimenta
programa de conversão. O --detecção automática converte apenas arquivos que incluem "#T2HTML-"
diretivas. Outros arquivos de texto não são convertidos.

--link-verificar -l
Verifique todos os links http e ftp. Esta opção is suposto para be corrida autônoma Opção
--quieto tem um significado especial quando usado com verificação de link.

Com esta opção você pode validar regularmente seu documento e remover links inativos ou
atualizar links movidos. Links problemáticos são enviados para stderr. Esta verificação de link
O recurso estará disponível somente se você tiver a biblioteca da web LWP instalada. O programa irá
verifique se você o possui em tempo de execução.

Links grandes, por exemplo, que correspondem tar.gz .zip ... ou que executam programas (links com
? caractere) são ignorados porque a solicitação GET usada na verificação retornaria inteiro
conteúdo do link e seria. ser muito caro.

Uma sugestão: Ao colocar links binários em seus documentos, adicione-os com espaço:

http://example.com/dir/dir/ nome do arquivo.tar.gz

Então o programa parece verifique os endereços http. Os usuários podem não conseguir obter o arquivo
com um clique, o verificador pode validar pelo menos o diretório. Se você não é o proprietário de
o link, também é possível que o arquivo tenha movido o nome da nova versão
apareceu.

-EU, --link-check-único
Imprimir saída condensada em grep -n como maneira ARQUIVO:LINHA:MENSAGEM

Esta opção concatena o texto da resposta do URL em uma única linha, para que você possa visualizar
as mensagens em uma linha. Você pode usar ferramentas de programação (como a compilação Emacs Mx) que
pode analisar a sintaxe grep padrão para ir para locais em seu documento para corrigir o
links mais tarde.

-ó, --Fora
grava o HTML gerado no arquivo derivado do nome do arquivo de entrada.

--out --print /dir/arquivo --> /dir/arquivo.html
--out --print /dir/arquivo.txt --> /dir/arquivo.html
--out --print /dir/file.this.txt --> /dir/file.this.html

--link-cache CACHE_FILE
Quando os links são verificados periodicamente, seria bastante rigoroso verificar cada link
toda vez que isso já deu certo. Para economizar tempo de verificação de links, o "ok"
os links podem ser armazenados em cache em um arquivo separado. Da próxima vez que você verificar os links, o cache será
aberto e apenas os links encontrados que não estavam no cache são verificados. Isto deveria
melhorar drasticamente pesquisas longas. Considere este exemplo, onde todo arquivo de texto é
verificado recursivamente.

$ t2html --link-check-single
--quiet --link-cache ~tmp/link.cache
`encontrar. -nome "*.txt" -tipo f`

-O, --out-dir DIR
Como --Fora, mas corte a parte do diretório e grave os arquivos de saída em DIR. A seguir
geraria o arquivo HTML para o diretório atual:

--out-dir .

Se você possui uma ferramenta automatizada que preenche o diretório, pode usar o word Nenhum para
ignore esta opção. O seguinte é autônomo, não gerará saída para o diretório
"nenhum":

--out-dir nenhum

-p, --imprimir
Imprime o nome do arquivo em stdout após o processamento HTML. Normalmente o programa não imprime nomes de arquivos,
apenas o HTML gerado.

% t2html --out --print página.txt

--> página.html

-P, --print-url
Imprima o nome do arquivo no formato URL. Isto é útil se você quiser verificar o layout
imediatamente com seu navegador.

% t2html --out --print-url página.txt | lince xargs

-> arquivo: /users/foo/txt/page.html

--dividir REGEXP
Divida o documento em pedaços menores quando REGEXP corresponder. Split comandos e guarante que os mesmos estão autônoma,
ou seja, que ele inicia e termina. Nenhuma conversão HTML para o arquivo está envolvida.

Se REGEXP for encontrado na linha, é o ponto inicial de uma divisão. Ex: dividir
de acordo com os títulos de nível superior, que não possuem numeração, você usaria:

--split '^[AZ]'

Um número sequencial, de 3 dígitos, é adicionado às parciais geradas:

nome do arquivo.txt-NNN

O recurso de divisão é útil se você deseja gerar slides de cada título: Primeiro
divida o documento, depois converta cada parte para HTML e finalmente imprima cada parte (página)
separadamente para a impressora.

-S1, --split1
Isto é uma abreviatura de --dividir comando. Defina regexp para dividir no título de nível superior.

-S2, --split2
Isto é uma abreviatura de --dividir comando. Defina regexp para dividir no título de segundo nível.

-SN, --arquivos nomeados divididos
Diretiva adicional para comandos split. Se você dividir, por exemplo, por títulos usando --split1,
seria mais informativo gerar nomes de arquivos de acordo com as primeiras palavras de
o nome do título. Suponha que os nomes dos títulos onde ocorre a divisão fossem:

Diretrizes do programa
Conclusão

Então os nomes dos arquivos parciais gerados seriam os seguintes.

FILENAME-program_guidelines
Conclusão FILENAME

-X, --xhtml
Renderize usando XHTML estrito. Isto significa usar , e parágrafos usam .. .

"Nota: esta opção é experimental. Veja BUGS"

Gerais opções
--depurar NÍVEL
Ative a depuração com número LEVEL positivo. Zero significa sem depuração.

--Socorro -h
Imprimir tela de ajuda. Termina o programa.

--help-css
Imprimir CSS padrão usado. Termina o programa. Você pode copiar e modificar esta saída e
instrua a usar o seu próprio com --css-file=ARQUIVO. Você também pode incorporar a opção aos arquivos
com a diretiva "#T2HTML-OPTION".

--ajuda-html
Imprima a ajuda em formato HTML. Termina o programa.

--ajuda-homem
Imprima a página de ajuda no formato de página de manual do Unix. Você deseja alimentar esta saída para nroff -homem
para lê-lo. Termina o programa.

--página de teste
Imprima a página de teste: HTML e arquivo de texto de exemplo que demonstra os recursos.

--Tempo
Imprime em stderr o tempo gasto para lidar com o arquivo.

-dentro, --verbose [NÍVEL]
Imprima mensagens detalhadas.

-q, --quieto
Não imprima nenhum rodapé. Esta opção tem significado diferente se --link-verificar opção
ativado: imprime apenas links errados.

V, --versão
Imprima informações sobre a versão do programa.

FORMATO DESCRIÇÃO


Programa converte arquivos de texto em HTML. A ideia básica é confiar no nível de indentação e
o layout usado é chamado de 'Formato técnico' (TF), onde apenas convenções mínimas são usadas
para marcar texto em itálico, negrito etc. Os princípios básicos podem ser demonstrados abaixo. Perceber
a régua de poisiton da coluna no topo:

--//-- início da descrição

123456789 123456789 123456789 123456789 123456789 números de coluna

O título 1 começa com uma letra grande na coluna 1 mais à esquerda

As posições da coluna 1,2,3 estão atualmente indefinidas e não podem
formate corretamente. Não coloque texto nas colunas 1,2 ou 3.

O nível de título 2 começa na coluna 4 de meia tabulação com uma letra grande

Texto normal, mas colorido nas colunas 5

Texto normal, mas colorido nas colunas 6

O título 3 pode ser considerado na posição TAB menos 1, coluna 7.

" O texto especial na coluna 7 começa com aspas duplas"

O texto padrão começa na coluna 8, você pode *enfatizar* o texto ou
torne-o _forte_ e escreva =SmallText= ou +BigText+ show
nome da variável `ThisIsAlsoVariable'. Você pode `_*aninhar*_' `o'
marcação. mais txt neste parágrafo txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt txt txt txt
texto

Texto forte na coluna 9

A coluna 10 é reservada para cotações
A coluna 10 é reservada para cotações
A coluna 10 é reservada para cotações
A coluna 10 é reservada para cotações

Texto forte na coluna 11

A coluna 12 e seguintes são reservadas para exemplos de código
A coluna 12 e seguintes são reservadas para exemplos de código
Todo o texto aqui está rodeado por Códigos HTML
Esta coluna CODE é afetada pelas opções --css-code*.

Título 2 na coluna 4 novamente

Se você quiser algo como Título nível 3, use a coluna 7 (negrito)

Coluna 8. Posição da guia padrão. txt txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt txt txt txt
[1998/09/10, Sr. Foo disse]:

texto citado texto citado texto citado texto citado texto citado
texto citado texto citado texto citado texto citado texto citado
texto citado texto citado texto citado texto citado texto citado
texto citado texto

* Marcador na coluna 8. Observe 3 espaços depois de (*), então
o texto começa em meia tabulação para frente na coluna 12.
* Bala. txt txt txt txt txt txt txt txt txt txt txt txt
* Bala. txt txt txt txt txt txt txt txt txt txt txt txt
,txt txt txt txt

Observe que o parágrafo anterior termina com vírgula P
código, ele diz a este parágrafo para continuar em
modo marcador, caso contrário, este texto na coluna 12
seria interpretado como uma seção de código mencionada
por Códigos HTML.

. Esta é uma lista ordenada.
. Esta é uma lista ordenada.
. Esta é uma lista ordenada.

.Esta linha começa com ponto wirg e é exibida sozinha na linha.
.Esta linha começa com ponto wirg e é exibida sozinha na linha.

!! Isto adiciona um Código HTML, o texto na linha é marcado com
!!

Torne este endereço de e-mail clicávelconta@tt.com> Não
tornar este endereço de e-mail clicável bar@exemplo.com, porque isso
é apenas um exemplo e não um endereço real. Observe que o
o último não estava cercado por <>. Nomes de login comuns como
foo, bar, quux ou 'exemplo' de site da Internet são ignorados
automaticamente.

Também não faça este@exemplo.com>porque há extra
espaço em branco. Esta pode ser a maneira mais conveniente de desativar o e-mail
endereços temporariamente.

Título1 novamente na coluna 0

Subtítulo na coluna 4

E texto normal, coluna 8 txt txt txt txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt txt txt txt txt
txt txt txt txt txt txt txt txt txt txt txt

--//-- fim da descrição

É isso, aí está todo o layout descrito. Mais formalmente, as regras do texto
a formatação está descrita abaixo.

USAVA TÍTULOS
· Há apenas dois níveis de título neste estilo. As colunas de cabeçalho são 0 e 4 e o
o título deve começar com uma letra grande ou um número

· na coluna 4, se o texto começar com letra minúscula, essa linha é interpretada como


· Um HTML a marca é adicionada logo antes de imprimir o título no nível 1.

· Os títulos são reunidos, o TOC é construído e inserido no início do HTML
página. O HTML referências usadas no TOC são as primeiras 4 palavras sequenciais do
títulos. Certifique-se de que seus títulos tenham nomes exclusivos, caso contrário, haverá o mesmo
Referências NAME no HTML gerado. Os espaços são convertidos em sublinhado quando
juntando as palavras. Se você não consegue escrever títulos exclusivos com quatro palavras, então você deve
usar --nome-uniq interruptor

TEXTO INVESTIMENTO REGRAS


Geral
As regras básicas para posicionar texto em determinadas colunas:

· O texto na coluna 0 é indefinido se não começar com letra grande ou número para
indicar Título nível 1.

· O texto entre as colunas 1-3 é marcado com

· A coluna 4 está reservada para o nível de rubrica 2

· O texto entre as colunas 5 a 7 está marcado com

· O texto na coluna 7 é se o primeiro caractere estiver entre aspas duplas.

· A coluna 10 é reservada para texto. Se você quiser citar alguém ou adicionar referência
texto, coloque o texto nesta coluna.

· O texto nas colunas 9,11 está marcado com

Coluna 8 para texto e códigos especiais

· A coluna 8 é reservada para texto normal

· No início do texto, na coluna 8, pode haver código DOT ou código COMMA.

A coluna 12 é especial

· A coluna 12 é tratada de maneira especial: o bloco é iniciado com e as linhas são marcadas como
. Quando o último texto em coluna 12 for encontrado, o bloco é fechado com
Observe o seguinte exemplo

txt txt txt ;bloco colocado uniformemente, tudo bem, faça assim
texto

txt txt txt txt ;Não é possível encerrar o /pre, porque o último
txt txt txt txt ;coluna não está em 12
txt txt txt txt txt

txt txt txt txt txt
txt txt txt txt txt
txt txt txt txt txt
;; Finalizando o comentário, agora o texto está posicionado uniformemente

Adicional tokens for usar at coluna 8
· Se houver "."(ponto) no início de uma linha e imediatamente sem espaço em branco, então
o código é adicionado ao final da linha.

.Esta linha terá um Tag HTML no final.
Enquanto essas duas linhas estão unidas
pelo navegador, dependendo da largura do quadro.

· Se houver ","(vírgula) então o o código não é inserido se a linha anterior for
vazio. Se você usar "."(ponto) e ","(vírgula), eles deverão estar na ordem ponto-vírgula. O
","(vírgula) funciona de maneira diferente se for usado no marcador

A é sempre adicionado se houver separação de parágrafos, mas quando você está escrevendo um
marcador, há um problema, porque um marcador só existe enquanto o texto for mantido
juntos

* Este é um marcador e contém todo o texto mantido junto
mesmo que haja outra linha no marcador.

Mas para escrever marcadores que se espalhem por vários parágrafos, você deve instruir que eles são
mantidos juntos e o texto no próximo parágrafo não é enquanto estiver colocado em
coluna 12

* Este é um marcador e contém todo o texto mantido junto
, mesmo que haja outra linha no marcador.

Este é um novo parágrafo do item anterior e é
não é uma amostra de texto. Veja a continuação do código COMMA acima.

* Este é um novo marcador

// e este é o exemplo de código após o marcador
if ($flag) {..faça alguma coisa..}

Destaque texto marcações
itálico, negrito, código, tokens pequenos e grandes
_isto_ é interpretado como isto
*isto* é interpretado como isto
'isto' é interpretado como esse `

Modificadores Exra que podem ser misturados com os acima. Normalmente, se você quiser uma fonte maior,
USE AS PALAVRAS EM MAIÚSCULA.

=isto= é interpretado como isto
+isto+ é interpretado como isto
[isto] é interpretado como isto

sobrescrito
word[this] é interpretado como sobrescrito. Você pode usar como
this[1], múltiplo[(2)] e quase qualquer[(ab)] e
imaginável[IV superscritps] contanto que a esquerda
colchete é anexado à palavra.

subscrito
12[[10]] é representação do valor 12 na base 10.
Isso é interpretado como subscrito. Você pode usar como
isto[[1]], múltiplos[[(2)]] e quase qualquer[[(ab)]] e
imaginável[[IV superscritps]] contanto que restem *dois*
colchetes são anexados à palavra.

incorporando tokens HTML padrão
Entidades HTML especiais padrão podem ser adicionadas dentro do texto de maneira normal, usando
nomes simbólicos ou o código hash. Aqui estão alguns exemplos:

× < > ≤ ≥ ≠ √ -
α β γ ÷
« » ‹ › - – —
≈ ≡ ∑ ƒ ∞
° ±
™ © ®
€£¥

incorporando HTML PURO no texto
Esta integrado is altamente experimental. É possível incorporar HTML puro dentro de texto em
ocasiões em que, por exemplo, é necessária alguma formatação especial. O isea é simples: você escreve
HTML como de costume, mas duplique cada caractere '<' e '>', como:

< >

A outra regra é que todo HTML PURO deve ser mantido junto. Não deve haver nenhuma linha
quebras entre linhas HTML puras. Isso está incorreto:

<

< >um
< >dois

< >

O HTML puro deve ser escrito sem novas linhas extras:

<
< >um
< >dois
< >

Essa "duplicação" também afeta as regras normais de escrita de texto. Se você escreve documentos,
onde você descreve documentos AQUI no estilo Unix, você NÃO DEVE colocar os tokens ao lado de
uns aos outros:

bash$ gato<
um
EOF

Você deve escrever o exemplo de código acima usando espaços para evitar que "<<" seja interpretado
como HTML PURO:

bash$ cat << EOF # RIGHT, adicione espaços
um
EOF

desenhando um pequeno separador
A !! (dois pontos de exclamação) na coluna de texto (posição 8) causa a adição imediata
código. qualquer texto depois !! na mesma linha é escrito com e inserido
logo após código, portanto os comandos de formatação de palavras não têm efeito neste
linha.

Http e email marca��o ao controle
· Todas as referências http e ftp, bem comofoo@exemplo.com> endereços de e-mail estão marcados
clicável. O e-mail deve ter caracteres <> adjacentes para ser reconhecido.

· Se o URL for precedido de hífen, não será clicável. Se uma string foo, bar, quux,
teste, o site é encontrado a partir do URL e não é contado como clicável.

<eu@here.com> clicável
http://example.com clicável

< eu@here.com> não clicável; contém espaço
<5dko56$1@news02.deltanet.com> Message-Id, não clicável

-http://example.com hífen, não clicável
http://$EXAMPLE variable. not clickable

listas e balas
· A tabela de boletins é construída se houver "o" ou "*" na coluna 8 e 3 espaços após
para que o texto comece na coluna 12. Recomenda-se que as linhas com marcadores sejam mantidas juntas;
sem espaços entre os blocos de marcadores.

· A lista ordenada é iniciada com ".", um ponto, e escrita como marcador onde o texto começa
na coluna 12.

Line quebra
· Todas as quebras de linha são visíveis no seu documento, não use mais de uma quebra de linha para
parágrafos separados.

· Muito importante é que só haja um quebra de linha após os títulos.

EMBEDDED DIRETIVAS DENTRO TEXTO


Opções de linha de comando
Você pode cancelar a obediência a todas as diretivas incorporadas fornecendo a opção --not2html-tags.

Você pode incluir essas linhas em qualquer lugar do documento e seu conteúdo será incluído em
Saída HTML. Cada linha diretiva deve caber em uma linha e não pode ser quebrada em
linhas separadas.

#T2HTML-TÍTULO
#T2HTML-EMAIL
#T2HTML-AUTOR
#T2HTML-DOC
#T2HTML-METAKEYWORDS
#T2HTML-METADESCRIÇÃO

Você pode passar opções de linha de comando incorporadas no arquivo. Curta se você quisesse o CÓDIGO
seção (coluna 12) a ser colorida com tons de cinza, você pode adicionar:

#T2HTML-OPTION --css-code-bg

Ou você pode solicitar a ativação de opções específicas. Observe que cada linha é exatamente
conforme você passou o argumento na linha de comando. Imagine cercar aspas duplas
em torno de linhas que são argumentos para as opções associadas.

#T2HTML-OPTION --como está
#T2HTML-OPTION --quiet
#T2HTML-OPTION --idioma
#T2HTML-OPTION pt
#T2HTML-OPTION --css-font-type
#T2HTML-OPÇÃO Trebuchet MS
#T2HTML-OPTION --css-code-bg
#T2HTML-OPTION --css-code-note
#T2HTML-OPTION (?:Nota|Aviso|Aviso):

Você também pode incorporar seus próprios comentários ao texto. Estes são eliminados:

#T2HTML-COMMENT Você comenta aqui
#T2HTML-COMMENT Você outro comentário aqui

Incorporando arquivos
#INCLUDE- comando

Isso é usado para incluir o conteúdo na posição atual. O URL pode ser um
referência de nome de arquivo, onde cada $VAR é substituído pelas variáveis ​​de ambiente. O
A expansão til(~) não é suportada. O nome do arquivo incluído é sistema operacional
localização do caminho suportado.

Um prefixo “raw:” desativa qualquer formatação normal. O conteúdo do arquivo é incluído como está.

A URL também pode ser uma referência HTTP para um local remoto, cujo conteúdo está incluído
no ponto. No caso de conteúdo remoto ou quando o nome do arquivo termina com a extensão ".html" ou
".html", o conteúdo é retirado para fazer a inclusão do conteúdo
possível. Na figura abaixo, apenas as linhas dentro do BODY, marcadas com !!, são
incluído:



...


esse texto !!
e mais disso!!



Exemplos:

#INCLUDE-$HOME/lib/html/picture1.html
#INCLUIR-http://www.example.com/code.html
#INCLUDE-raw:exemplo/code.html

Incorporando fotos
O comando #PIC é usado para incluir imagens no texto

#PIC picture.png#Texto da legenda#Atributos HTML da imagem#align#
(1) (2) (3) (4)

1. O NOME ou endereço URL da imagem. Curtir imagem/this.png

2. O texto que aparece abaixo da imagem

3. Atributos adicionais anexados dentro marcação.
Para , a linha seria
ler:

#PIC some.png#Texto da legenda#largura=200 comprimento=200##

4. A posição da imagem: “esquerda” (padrão), “centro”, “direita”

Nota: O "Texto da legenda" também se tornará o texto ALT da imagem usada no
caso o navegador não seja capaz de mostrar imagens. Você pode suprimir o texto ALT
com opção --sem imagem-alt.

Identificadores de fragmentos para tags nomeadas
O comando #REF é usado para se referir a HTML tag dentro do documento atual. O
o comando inteiro deve ser colocado em uma única linha e não pode ser dividido em vários
linhas. Um exemplo:

#REF #how_to_profile;(Nota: criação de perfil);
(1) (2)

1. A referência da tag HTML NAME no documento atual, uma única palavra.
Também pode ser um link de URL completo.
Você pode obter a lista NOME ativando a opção --toc-url-print.

2. O texto clicável é delimitado por ; personagens.

Referindo-se a documentos externos.
A tag "#URL" pode ser usada para incorporar URLs in-line, de modo que o link completo não fique visível.
Apenas o texto mostrado é usado para ir para o URL. Esta directiva não pode ser violada
linhas separadas,

#URL
| |
| espaço em branco permitido aqui
Devem ser mantidos juntos

Como se estivesse escrito:

Veja o mecanismo de pesquisa #URLhttp://www.google.com>

TABELA OF CONTEÚDOS RUBRICA


Se houver o título 1, que é denominado exatamente "Índice", então todo o texto até
próximo título são descartados do arquivo HTML gerado. Isto é feito porque o programa
gera seu próprio TOC. Supõe-se que você use algum programa de formatação de texto para
gere o toc para você em arquivo .txt e você não o mantém manualmente. Por exemplo
Pacote Emacs tinytf.el pode ser usado.

PROBLEMAS


Gerado HTML documento fez não olhar o que I Pretendido
O erro mais comum é que existem novas linhas extras no documento. Manter um vazio
linha entre os títulos e o texto, mantenha um linha vazia entre parágrafos, mantenha um vazio
linha entre o corpo do texto e o marcador. Faça disso o seu mantra: um um um ...

Em seguida, você pode ter colocado o texto na posição errada da coluna. Lembre-se de que o texto normal está em
coluna 8.

Se o HTML gerado começar repentinamente a usar apenas uma fonte, por exemplo , então você se esqueceu de
feche o bloco. Faça com que seja lido uniformemente, assim:

Bloco de código
Bloco de código
Bloco de código
;; Adicione um comentário vazio aqui para "fechar" o exemplo de código na coluna 12

Os títulos começam com uma letra ou número grande, como em "Título", não em "Título". Dupla verificação
a soletração.

EXEMPLOS


Para imprimir a página de teste e mostrar todas as possibilidades:

t2html --página de teste

Para criar uma página HTML simples sem nenhuma meta informação:

t2html --title "Título da página HTML" --author "Sr. Foo"
--simple --out --print arquivo.txt

Se você tiver postagens periódicas em formato de e-mail, use --delete-email-headers ignorar o cabeçalho
texto:

t2html --out --print --delete-email-headers page.txt

Para tornar a página rápida

t2html --html-frame --out --print page.txt

Para converter a página de um documento de texto, incluindo meta tags, botões, cores e molduras. Pagar
atenção para mudar --html-corpo que define o idioma do documento.

t2html
--imprimir
--Fora
--autor "Sr. foo"
--e-mail "foo@exemplo.com"
--title "Esta é a página de manual da página BAR"
--html-body LANG=en
--button-prev anterior.html
--button-top index.html
--buttion-próximo próximo.html
--documento http://example.com/dir/this-page.html
--urlmanual.html
--css-código-bg
--css-code-note '(?:Nota|Aviso|Aviso):'
--html-quadro
--disclaimer-file $HOME/txt/my-html-footer.txt
--meta-keywords "idioma-pt,manual,programa"
--meta-description "Programa de barra para fazer isso e muito mais"
manual.txt

Para verificar links e imprimir o status de todos os links juntamente com a mensagem de erro http (a maioria
detalhado):

t2html --link-verificar arquivo.txt | tee link-error.log

Para imprimir apenas links problemáticos:

t2html --link-check --quiet arquivo.txt | tee link-error.log

Para imprimir uma saída concisa da mesma maneira egep -n: número da linha, link e código de erro:

t2html --link-check-single --quiet arquivo.txt | tee link-error.log

Para verificar links de várias páginas e armazenar links bons em arquivos separados, use --link-cache
opção. A próxima verificação de link será executada muito mais rapidamente porque os links válidos armazenados em cache não serão
buscado novamente. Em intervalos regulares, exclua o arquivo de cache do link para forçar a verificação completa.

t2html --link-check-single
--link-cache $HOME/tmp/link.cache
--quiet arquivo.txt

Para dividir um documento grande em partes e converter cada parte em HTML:

t2html --split1 --arquivo de nome dividido.txt | t2html --simple --out

MEIO AMBIENTE


EMAIL
Se variável de ambiente EMAIL é definido, ele é usado no rodapé do endereço de contato.
Opção --o email substitui a configuração do ambiente.

GRANDE
A configuração de idioma padrão para a opção "--idioma" Certifique-se de que os dois primeiros
caracteres contém a definição do idioma, como em: LANG=en.iso88591

Use t2html online usando serviços onworks.net



Programas online mais recentes para Linux e Windows