นี่คือคำสั่ง uni2ascii ที่สามารถเรียกใช้ในผู้ให้บริการโฮสติ้งฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
uni2ascii - แปลง UTF-8 Unicode เป็นการแสดงแทน ASCII 7 บิตต่างๆ
เรื่องย่อ
Uni2ascii [ตัวเลือก] ( ไฟล์ ชื่อ>)
DESCRIPTION
Uni2ascii แปลง UTF-8 Unicode เป็นการแสดงแทน ASCII 7 บิตต่างๆ หากไม่มีรูปแบบเป็น
กำหนด ใช้รูปแบบเลขฐานสิบหกมาตรฐาน (เช่น 0x00e9) มันอ่านจากมาตรฐาน
อินพุตและเขียนไปยังเอาต์พุตมาตรฐาน
ตัวเลือกบรรทัดคำสั่งคือ:
-A แสดงรายการการประมาณอักขระตัวเดียวที่ดำเนินการโดยแฟล็ก -y
-a
แปลงเป็นรูปแบบที่กำหนด กำหนดรูปแบบได้ดังนี้
รหัสอักขระตัวเดียวตามอำเภอใจ โดยใช้ชื่อเช่น "SGML_decimal" และโดย
ตัวอย่างรูปแบบที่ต้องการ
A สร้างเลขฐานสิบหกที่มีคำนำหน้า U ในวงเล็บเหลี่ยม ( ).
B สร้างเลขฐานสิบหก \x (เช่น \x00E9)
C สร้าง \x ยกเว้นตัวเลขฐานสิบหกในวงเล็บปีกกา (เช่น \x{00E9})
D สร้างการอ้างอิงอักขระตัวเลข HTML ทศนิยม (เช่น é)
E สร้างเลขฐานสิบหกด้วยคำนำหน้า U (U00E9)
F สร้างเลขฐานสิบหกด้วยคำนำหน้า u (u00E9)
G แปลงเลขฐานสิบหกในเครื่องหมายคำพูดเดี่ยวด้วยคำนำหน้า X (เช่น X'00E9')
H สร้างการอ้างอิงอักขระที่เป็นตัวเลข HTML ฐานสิบหก (เช่น é)
I สร้างเลขฐานสิบหก UTF-8 ด้วยเลขฐานสิบหกของแต่ละไบต์นำหน้าด้วยเครื่องหมาย = (เช่น
=C3=A9) . นี่คือรูปแบบ Quoted Printable ที่กำหนดโดย RFC 2045
J สร้างเลขฐานสิบหก UTF-8 ด้วยเลขฐานสิบหกของแต่ละไบต์นำหน้าด้วยเครื่องหมาย % (เช่น
%C3%A9). นี่คือรูปแบบหลีก URI ที่กำหนดโดย RFC 2396
K สร้าง UTF-8 ฐานแปดโดยแต่ละไบต์ใช้หลีกด้วยแบ็กสแลช (เช่น \303\251)
L สร้าง \u-escaped hex นอก BMP \u-escaped hex ภายใน BMP
(U+0000-U+FFFF)
M สร้างการอ้างอิงอักขระตัวเลข SGML ฐานสิบหก (เช่น \#xE9;)
N สร้างการอ้างอิงอักขระตัวเลข SGML ทศนิยม (เช่น \#233;)
O สร้าง Escape ฐานแปดสำหรับไบต์ต่ำสามไบต์ในลำดับ big-endian (เช่น
\000\000\351))
P สร้างตัวเลขฐานสิบหกที่มีคำนำหน้า U+ (เช่น U+00E9)
Q สร้างเอนทิตีอักขระ (เช่น é) หากเป็นไปได้ มิฉะนั้น เลขฐานสิบหก
การอ้างอิงอักขระที่เป็นตัวเลข
R สร้างเลขฐานสิบหกดิบ (เช่น 00E9)
S สร้างค่า Escape เลขฐานสิบหกสำหรับไบต์ต่ำสามไบต์ในลำดับ big-endian (เช่น
\x00\x00\xE9)
T สร้างค่าหลีกทศนิยมสำหรับไบต์ต่ำสามไบต์ในลำดับ big-endian (เช่น
\d000\d000\d233)
U สร้างเลขฐานสิบหกที่มีค่า Escape (เช่น \u00E9)
V สร้าง \u-Esced เลขฐานสิบ (เช่น \u00233)
X สร้างเลขฐานสิบหกมาตรฐาน (เช่น 0x00E9)
0 สร้างฐานสิบหก UTF-8 ด้วยเลขฐานสิบหกของแต่ละไบต์อยู่ภายในวงเล็บมุม
(เช่น ).
1 สร้างตัวเลขฐานสิบหกรูปแบบ Lisp ทั่วไป (เช่น #x00E9)
2 สร้างตัวเลขทศนิยมรูปแบบ Perl ด้วยคำนำหน้า v (เช่น v233)
3 สร้างตัวเลขฐานสิบหกที่มีคำนำหน้า $ (เช่น $00E9)
4 สร้างตัวเลขฐานสิบหกรูปแบบ Postscript พร้อมคำนำหน้า 16# (เช่น 16#00E9)
5 สร้างตัวเลขฐานสิบหกรูปแบบ Lisp ทั่วไปพร้อมคำนำหน้า #16r (เช่น #16r00E9)
6 สร้างตัวเลขฐานสิบหกรูปแบบ ADA พร้อมคำนำหน้า 16# และส่วนต่อท้าย # (เช่น
16#00E9#)
7 สร้างรูปแบบบันทึกของ Apache ฐานสิบหก UTF-8 ด้วยเลขฐานสิบหกของแต่ละไบต์นำหน้าด้วยa
แบ็กสแลช-x (เช่น \xC3\xA9)
8 สร้างตัวเลขฐานสิบหกรูปแบบ Microsoft OOXML พร้อมคำนำหน้า _x และส่วนต่อท้าย _
(เช่น _x00E9_)
9 สร้าง %\u-esc เลขฐานสิบหก (เช่น %\u00E9)
-B แปลงเป็น ASCII ถ้าเป็นไปได้ ตัวเลือกนี้เทียบเท่ากับชุดค่าผสม cdefx
-c แปลงอักขระในวงกลมและวงเล็บเป็นอักขระที่ไม่ปิด
-d แถบกำกับเสียง สิ่งนี้จะแปลง codepoints เดียวแทนอักขระด้วย
ตัวกำกับเสียงสำหรับอักขระ ASCII ที่สอดคล้องกันและลบการเข้ารหัสแยกกัน
กำกับเสียง
-e แปลงอักขระให้เทียบเท่ากับ ASCII โดยประมาณดังนี้:
U+0085 บรรทัดถัดไป 0x0A ขึ้นบรรทัดใหม่
U+00A0 ไม่มีช่องว่าง 0x20 ช่องว่าง
U+00AB เครื่องหมายอัญประกาศมุมคู่ชี้ซ้าย 0x22 อัญประกาศคู่
U+00AD ยัติภังค์อ่อน 0x2D ลบ
U+00AF มาครง 0x2D ลบ
U+00B7 จุดกลาง 0x2E ช่วงเวลา
U+00BB เครื่องหมายอัญประกาศคู่ชี้ขวา 0x22 เครื่องหมายอัญประกาศคู่
U+1361 ช่องว่างคำตามหลักจริยธรรม 0x20 ช่องว่าง
U+1680 โอแฮม สเปซ 0x20 สเปซ
U+2000 en quad 0x20 พื้นที่
U+2001 พื้นที่สี่เหลี่ยม 0x20
U+2002 en space 0x20 ช่องว่าง
U+2003 เว้นวรรค 0x20 เว้นวรรค
U+2004 สามต่อหนึ่งพื้นที่ 0x20 ช่องว่าง
U+2005 พื้นที่สี่ต่อเอ็ม 0x20 พื้นที่
U+2006 พื้นที่หกต่อเอ็ม 0x20 พื้นที่
U+2007 ฟิกเกอร์สเปซ 0x20 สเปซ
U+2008 วรรคตอน 0x20 วรรค
U+2009 บางพื้นที่ 0x20 พื้นที่
U+200A แฮร์สเปซ 0x20 สเปซ
พื้นที่กว้าง U+200B 0x20 พื้นที่
U+2010 ยัติภังค์ 0x2D ลบ
U+2011 ยัติภังค์ไม่แตก 0x2D ลบ
U+2012 ฟิกเกอร์แดช 0x2D ลบ
U+2013 en dash 0x2D ลบ
U+2014 em dash 0x2D ลบ
U+2018 เหลือเครื่องหมายอัญประกาศเดี่ยว 0x60 เหลืออัญประกาศเดี่ยว
U+2019 เครื่องหมายอัญประกาศเดี่ยว 0x27 ขวาหรือเป็นกลาง
หุ้น
U+201A เครื่องหมายอัญประกาศเดี่ยว 9 ต่ำ 0x60 เหลืออัญประกาศเดี่ยว
U+201B single high-reversed-9 อัญประกาศ 0x60 เหลืออัญประกาศเดี่ยว
U+201C เหลือเครื่องหมายอัญประกาศคู่ 0x22 อัญประกาศคู่
U+201D เครื่องหมายอัญประกาศคู่ขวา 0x22 อัญประกาศคู่
U+201E เครื่องหมายอัญประกาศคู่ต่ำ-9 0x22 อัญประกาศคู่
U+201F เครื่องหมายอัญประกาศ 9 แบบย้อนกลับสูงสองเท่า 0x22 เครื่องหมายอัญประกาศคู่
U+2022 สัญลักษณ์แสดงหัวข้อย่อย 0x6F อักษรตัวเล็ก o
U+2028 ตัวคั่นบรรทัด 0x0A ขึ้นบรรทัดใหม่
U+2033 ดับเบิ้ลไพรม์ 0x22 อัญประกาศคู่
U+2039 เครื่องหมายอัญประกาศมุมชี้ซ้ายเดียว 0x60 เครื่องหมายอัญประกาศเดี่ยว
U+203A เครื่องหมายอัญประกาศมุมแหลมเดียว 0x27 ขวาหรือกลางเดียว
หุ้น
U+204E เครื่องหมายดอกจันต่ำ 0x2A เครื่องหมายดอกจัน
U+2212 เครื่องหมายลบ 0x2D ลบ
U+2216 ชุดลบ 0x5C แบ็กสแลช
U+2217 เครื่องหมายดอกจัน 0x2A เครื่องหมายดอกจัน
U+2223 หาร 0x7C เส้นแนวตั้ง
U+2500 กล่องไฟวาดแนวนอน 0x2D ลบ
กล่อง U+2501 วาดแนวนอนหนัก 0x2D ลบ
U+2502 ไฟส่องกล่องแนวตั้ง 0x7C เส้นแนวตั้ง
กล่อง U+2503 วาดเส้นแนวตั้งหนัก 0x7C แนวตั้ง
U+2731 เครื่องหมายดอกจันหนัก 0x2A เครื่องหมายดอกจัน
U+275D เครื่องหมายอัญประกาศจุลภาคแบบหมุนสองครั้งหนัก 0x22 เครื่องหมายอัญประกาศคู่
U+275E เครื่องหมายอัญประกาศคู่หนา 0x22 อัญประกาศคู่
U+3000 พื้นที่ความคิด 0x20 พื้นที่
U+FE60 เครื่องหมายขนาดเล็กและ 0x26 เครื่องหมายและ
U+FE61 เล็กดอกจัน 0x2A ดอกจัน
U+FE62 เครื่องหมายบวกขนาดเล็ก 0x2B เครื่องหมายบวก
-E แสดงรายการการขยายที่ดำเนินการโดยแฟล็ก -x
-f แปลงรูปแบบโวหารเป็น ASCII ธรรมดา เทียบเท่าโวหารรวมถึง:
รูปแบบตัวยกและตัวห้อย ตัวพิมพ์เล็ก (เช่น U+1D04) รูปแบบสคริปต์ (เช่น
U+212C), รูปแบบตัวอักษรสีดำ (เช่น U+212D), รูปแบบเต็มความกว้าง (เช่น U+FF01), halfwidth
รูปแบบ (เช่น U+FF7B) และสัญลักษณ์ทางคณิตศาสตร์และตัวเลข (เช่น U+1D400)
-h ช่วย. พิมพ์ข้อความการใช้งานและออก
-l ใช้ af ตัวพิมพ์เล็กเมื่อสร้างเลขฐานสิบหก
-n แปลงขึ้นบรรทัดใหม่ด้วย โดยค่าเริ่มต้น พวกเขาจะถูกทิ้งไว้ตามลำพัง
-P ส่งผ่าน Unicode แทนที่จะแปลงเป็น ASCII Escape หากอักขระเป็น
ไม่แปลงเป็นอักขระ ASCII โดยการแปลงเช่น diacritic
ปอก โปรดทราบว่าหากใช้ตัวเลือกนี้ เอาต์พุตอาจไม่ใช่ ASCII ล้วน
-p บริสุทธิ์. แปลงอักขระภายในช่วง ASCII ยกเว้นช่องว่างและขึ้นบรรทัดใหม่ as
เช่นเดียวกับข้างต้น
-q เงียบ. อย่าแชทโดยไม่จำเป็นขณะทำงาน
-s แปลงอักขระช่องว่างด้วย โดยค่าเริ่มต้น พวกเขาจะถูกทิ้งไว้ตามลำพัง
-S
ระบุการแทนที่แบบกำหนดเอง อาร์กิวเมนต์ควรประกอบด้วย Unicode codepoint
จะถูกแทนที่ด้วยรหัส ASCII ของอักขระที่จะใช้เป็น
แทนที่คั่นด้วยเครื่องหมายทวิภาค หากไม่มีรหัส ASCII ที่ตามหลังทวิภาค ค่า
อักขระ Unicode ที่ระบุจะถูกลบ ค่ารหัสอาจอยู่ใน
เลขฐานสิบหก ฐานแปด หรือทศนิยมตามแบบแผนปกติ
of สตรูล(3)). ตัวเลือกนี้สามารถทำซ้ำได้หลายครั้งตามต้องการเพื่อกำหนด
การทดแทนหลายรายการ
-v พิมพ์ข้อมูลรุ่นโปรแกรมและออก
-w เพิ่มช่องว่างหลังแต่ละรายการแปลง
-x ขยายอักขระบางตัวเป็นลำดับหลายอักขระ ตัวละครที่ได้รับผลกระทบคือ
เช่นเดียวกับที่ได้รับผลกระทบจากตัวเลือก -y
U+00A2 เซ็นต์เซ็นต์ -> เซ็นต์
U+00A3 เครื่องหมายปอนด์ -> ปอนด์
U+00A5 ค่าเงินเยน -> เยน
U+00A9 สัญลักษณ์ลิขสิทธิ์ -> (c)
สัญลักษณ์ลงทะเบียน U+00AE -> (R)
U+00BC หนึ่งไตรมาส -> 1/4
U+00BD ครึ่งหนึ่ง -> 1/2
U+00BE สามไตรมาส -> 3/4
U+00C6 ตัวพิมพ์ใหญ่ ขี้เถ้า -> AE
U+00DF อักษรตัวพิมพ์เล็ก SHARP S -> ss
U+00E6 เถ้าตัวพิมพ์เล็ก -> ae
U+0132 LIGATURE IJ -> IJ
U+0133 LIGATURE ij -> ij
U+0152 ลิเกเจอร์ OE -> OE
U+0153 LIGATURE oe -> oe
U+01F1 ตัวพิมพ์ใหญ่ DZ -> DZ
U+01F2 อักษรผสม Dz -> Dz
U+01F3 อักษรตัวเล็ก DZ -> dz
U+02A6 อักษรตัวพิมพ์เล็ก TS DIGRAPH -> ts
U+2026 จุดไข่ปลาแนวนอน -> ...
U+20AC ลงชื่อยูโร -> ยูโร
U+22EF จุดไข่ปลาแนวนอนตรงกลาง -> ...
U+2190 ลูกศรซ้าย -> <-
U+2192 ลูกศรชี้ไปทางขวา -> ->
U+21D0 ไปทางซ้าย ลูกศรคู่ -> <=
U+21D2 ไปทางขวา ลูกศรคู่ -> =>
U+FB00 LATIN SMALL LIGATURE FF -> ff
U+FB01 LATIN SMALL LIGATURE FI -> fi
U+FB02 LATIN SMALL LIGATURE FL -> fl
U+FB03 LATIN SMALL LIGATURE FFI -> ffi
U+FB04 LATIN SMALL LIGATURE FFL -> ffl
U+FB06 LATIN SMALL LIGATURE ST -> st
-y แปลงอักขระบางตัวที่มีการขยายหลายอักขระเป็นอักขระเดียว
การประมาณ ascii แทน (เช่น เพื่อรักษาตำแหน่งอักขระ) NS
อักขระที่ได้รับผลกระทบจะเหมือนกับอักขระที่ได้รับผลกระทบจากตัวเลือก -x
U+00A2 เซ็นต์เซ็นต์ -> c
U+00A3 เครื่องหมายปอนด์ -> #
U+00A5 เยน ลงชื่อ -> Y
U+00A9 สัญลักษณ์ลิขสิทธิ์ -> C
สัญลักษณ์ลงทะเบียน U+00AE -> R
U+00BC หนึ่งไตรมาส -> -
U+00BD ครึ่งหนึ่ง -> -
U+00BE สามไตรมาส -> -
U+00C6 ตัวพิมพ์ใหญ่ ขี้เถ้า -> A
U+00DF อักษรตัวพิมพ์เล็ก SHARP S -> s
U+00E6 เถ้าตัวพิมพ์เล็ก -> a
U+0132 LIGATURE IJ -> ฉัน
U+0133 LIGATURE ij -> i
U+0152 LIGATURE OE -> O
U+0153 LIGATURE oe -> o
U+01F1 ตัวพิมพ์ใหญ่ DZ -> D
U+01F2 อักษรผสม Dz -> ด
U+01F3 อักษรตัวเล็ก DZ -> d
U+02A6 อักษรตัวเล็ก TS DIGRAPH -> t
U+2026 จุดไข่ปลาแนวนอน -> .
ลงชื่อ U+20AC ยูโร -> E
U+22EF จุดไข่ปลาแนวนอนตรงกลาง ->
U+2190 ลูกศรซ้าย ->
U+2192 ลูกศรชี้ไปทางขวา -> >
U+21D0 ไปทางซ้าย ลูกศรคู่ ->
U+21D2 ไปทางขวา ลูกศรคู่ -> >
-Z
สร้างเอาต์พุตโดยใช้รูปแบบที่ให้มา รูปแบบที่ระบุจะถูกใช้เป็น
จัดรูปแบบสตริงในการเรียกไปยัง printf(3) โดยมีอาร์กิวเมนต์เดียวประกอบด้วย an
จำนวนเต็มยาวที่ไม่ได้ลงนาม ตัวอย่างเช่น เพื่อให้ได้เอาต์พุตเดียวกันกับแฟล็ก -U
รูปแบบจะเป็น: \u%04X
หากการแปลงช่องว่างถูกปิดใช้งาน (ตามค่าเริ่มต้น) หากเว้นวรรคอักขระภายนอก
พบช่วง ASCII (พื้นที่เชิงอุดมคติ U+3000, พื้นที่คำ U+1351 เอธิโอเปีย และ
U+1680 ogham space mark) พวกมันจะถูกแทนที่ด้วยอักขระช่องว่าง ASCII (0x20) ดังนั้น as
ให้เอาต์พุต ASCII 7 บิตบริสุทธิ์
โปรดทราบว่าเอนทิตีอักขระที่เป็นตัวเลข XML และ XHTML เหมือนกับ HTML ที่มี two
ข้อ จำกัด. อย่างแรก ใน X(HT)ML เครื่องหมายเซมิโคลอนที่สิ้นสุดต้องไม่ละเว้น ประการที่สอง ใน
X(HT)ML "x" ต้องเป็นตัวพิมพ์เล็ก ในขณะที่ใน HTML อาจเป็นตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กก็ได้
เราสร้างเซมิโคลอนที่สิ้นสุดเสมอและใช้ "x" ตัวพิมพ์เล็กเสมอ ดังนั้นตัวเลือก
ขนานนามว่า "HTML" สร้าง XML และ XHTML ที่ถูกต้องเช่นกัน
EXIT สถานภาพ
ค่าต่อไปนี้จะถูกส่งคืนเมื่อออก:
0 ความสำเร็จ
อินพุตถูกแปลงเรียบร้อยแล้ว
2 ข้อผิดพลาดของ I/O
เกิดข้อผิดพลาดของระบบระหว่างอินพุตหรือเอาต์พุต
3 INFO ผู้ใช้ร้องขอข้อมูล เช่น หมายเลขรุ่นหรือเรื่องย่อการใช้งาน และ
นี้ได้รับการจัดเตรียม
5 ตัวเลือกที่ไม่ดี
ตั้งค่าสถานะตัวเลือกที่ไม่ถูกต้องในบรรทัดคำสั่ง
8 บันทึกที่ไม่ดี
ตรวจพบ UTF-8 ที่มีรูปแบบไม่ถูกต้องในอินพุต
ใช้ uni2ascii ออนไลน์โดยใช้บริการ onworks.net