นี่คือคำสั่ง uconv ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
ยูคอนวี - แปลงข้อมูลจากการเข้ารหัสหนึ่งไปยังอีกการเข้ารหัสหนึ่ง
เรื่องย่อ
ยูคอนวี [ -h, -?, --ช่วยด้วย ] [ -V, --รุ่น ] [ -s, --เงียบ ] [ -v, --รายละเอียด ] [ -l, --รายการ
| -l, --รายการรหัส รหัส | --รหัสเริ่มต้น | -L, --รายการ-ผู้แปล ] [ --แคนนอน ] [ -x
การทับศัพท์ ] [ --to-โทรกลับ โทรกลับ | -c ] [ --จาก-โทรกลับ โทรกลับ | -i ] [
--โทรกลับ โทรกลับ ] [ --รั้งท้าย | --ไม่มีทางเลือก ] [ -b, --ขนาดบล็อก ขนาด ] [ -f,
--จาก-รหัส การเข้ารหัส ] [ -t, --to-รหัส การเข้ารหัส ] [ --add-ลายเซ็น ] [ --ลบ-ลายเซ็น
] [ -o, --เอาท์พุท ไฟล์ ] [ ไฟล์-
DESCRIPTION
ยูคอนวี แปลงหรือแปลงรหัสแต่ละอันให้ ไฟล์ (หรืออินพุตมาตรฐานถ้าไม่มี ไฟล์ is
ที่ระบุ) จากหนึ่ง การเข้ารหัส ไปอีก การแปลงรหัสทำได้โดยใช้ Unicode เป็น pivot
การเข้ารหัส (กล่าวคือ ข้อมูลจะถูกแปลงจากการเข้ารหัสดั้งเดิมเป็น Unicode ก่อน และ
จากนั้นจาก Unicode ไปจนถึงการเข้ารหัสปลายทาง)
หาก การเข้ารหัส ไม่ได้ระบุหรือ is -จะใช้การเข้ารหัสเริ่มต้น ดังนั้นการเรียก ยูคอนวี
ไม่มี การเข้ารหัส ให้วิธีที่ง่ายในการตรวจสอบและฆ่าเชื้อไฟล์ข้อมูลเพื่อเพิ่มเติม
ปริมาณการใช้โดยเครื่องมือที่ต้องการข้อมูลในการเข้ารหัสเริ่มต้น
เมื่อโทร ยูคอนวี, เป็นไปได้ที่จะระบุการเรียกกลับที่ใช้ในการจัดการ ไม่ถูกต้อง
อักขระในอินพุตหรืออักขระที่ไม่สามารถแปลงรหัสไปยังปลายทางได้
การเข้ารหัส การเข้ารหัสบางตัว เช่น เสนออักขระทดแทนเริ่มต้นที่สามารถเป็น
ใช้เพื่อแสดงถึงการเกิดขึ้นของอักขระดังกล่าวในการป้อนข้อมูล การโทรกลับอื่นๆ เสนอ a
การแสดงภาพที่เป็นประโยชน์ของข้อมูลที่ไม่ถูกต้อง
ยูคอนวี ยังสามารถเรียกใช้งานที่ระบุ การทับศัพท์ ในข้อมูลที่แปลงซึ่งในกรณีนี้
การทับศัพท์จะเกิดขึ้นเป็นขั้นตอนกลาง หลังจากที่ข้อมูลได้รับการแปลงแล้ว
สู่ยูนิโค้ด NS การทับศัพท์ สามารถเป็นรายการคั่นด้วยอัฒภาค
ชื่อผู้แปลหรือชุดกฎที่ซับซ้อนโดยพลการในการทับศัพท์ของ ICU
รูปแบบกฎ
เพื่อวัตถุประสงค์ในการแปลงรหัส ยูคอนวี ตัวเลือกเข้ากันได้กับตัวเลือกของ iconv(1) ทำให้
ง่ายต่อการแทนที่ในสคริปต์ ไม่จำเป็นต้องเป็นกรณีที่การเข้ารหัส
ชื่อที่ใช้โดย ยูคอนวี และไอซียูก็เหมือนกับไอซียูที่ใช้โดย iconv(1). นอกจากนี้ตัวเลือกที่
ให้ข้อมูลข่าวสาร เช่น -l, --รายการ หนึ่งเสนอโดยบางคน iconv(1) รุ่นต่างๆ
เช่น GNU สร้างข้อมูลในรูปแบบที่แตกต่างเล็กน้อยและแยกวิเคราะห์ได้ง่ายขึ้น
OPTIONS
-h, -?, --ช่วยด้วย
พิมพ์ความช่วยเหลือเกี่ยวกับการใช้งานและการออก
-V, --รุ่น
พิมพ์เวอร์ชั่นของ ยูคอนวี และออก
-s, --เงียบ
ระงับข้อความระหว่างดำเนินการ
-v, --รายละเอียด
แสดงข้อความข้อมูลพิเศษระหว่างดำเนินการ
-l, --รายการ
แสดงรายการการเข้ารหัสที่มีอยู่ทั้งหมดและออก
-l, --รายการรหัส รหัส
ระบุเฉพาะ รหัส การเข้ารหัสและออก ถ้า รหัส ไม่ใช่การเข้ารหัสที่เหมาะสม ให้ออกด้วย
ข้อผิดพลาด
--รหัสเริ่มต้น
ระบุเฉพาะชื่อของการเข้ารหัสและออกเริ่มต้นเท่านั้น
-L, --รายการ-ผู้แปล
แสดงรายการตัวถอดเสียงที่มีอยู่ทั้งหมดและออก
--แคนนอน
ถ้าใช้กับ -l, --รายการ or --รหัสเริ่มต้น, รายการการเข้ารหัสผลิตใน a
รูปแบบที่เข้ากันได้กับ convtrrs.txt(5). ถ้าใช้กับ -L, --รายการ-ผู้แปล,
พิมพ์ชื่อตัวทับศัพท์เพียงชื่อเดียวต่อบรรทัด
-x การทับศัพท์
เรียกใช้ที่กำหนด การทับศัพท์ บนข้อมูล Unicode ที่แปลงแล้วและใช้
ข้อมูลทับศัพท์เป็นอินพุตสำหรับการแปลงรหัสไปยังการเข้ารหัสปลายทาง
--to-โทรกลับ โทรกลับ
ใช้ โทรกลับ เพื่อจัดการกับอักขระที่ไม่สามารถแปลงเป็นปลายทางได้
การเข้ารหัส ดูหัวข้อ คอลแบ็ค สำหรับรายละเอียดเกี่ยวกับการโทรกลับที่ถูกต้อง
-c ละเว้นอักขระที่ไม่ถูกต้องออกจากเอาต์พุต เหมือนกับ --to-โทรกลับ ข้าม.
--จาก-โทรกลับ โทรกลับ
ใช้ โทรกลับ เพื่อจัดการกับอักขระที่ไม่สามารถแปลงจากต้นฉบับ
การเข้ารหัส ดูหัวข้อ คอลแบ็ค สำหรับรายละเอียดเกี่ยวกับการโทรกลับที่ถูกต้อง
-i ละเว้นลำดับที่ไม่ถูกต้องในอินพุต เหมือนกับ --จาก-โทรกลับ ข้าม.
--โทรกลับ โทรกลับ
ใช้ โทรกลับ เพื่อจัดการกับอักขระทั้งสองที่ไม่สามารถแปลงจากต้นฉบับ
การเข้ารหัสและอักขระที่ไม่สามารถแปลงเป็นการเข้ารหัสปลายทางได้ ดู
ส่วน คอลแบ็ค สำหรับรายละเอียดเกี่ยวกับการโทรกลับที่ถูกต้อง
--รั้งท้าย
ใช้การแมปทางเลือกเมื่อแปลงรหัสจาก Unicode เป็นการเข้ารหัสปลายทาง
--ไม่มีทางเลือก
อย่าใช้การแมปทางเลือกเมื่อแปลงรหัสจาก Unicode ไปยังปลายทาง
การเข้ารหัส นี่คือค่าเริ่มต้น
-b, --ขนาดบล็อก ขนาด
อ่านอินพุตในบล็อกของ ขนาด ไบต์ในแต่ละครั้ง ขนาดบล็อกเริ่มต้นคือ 4096
-f, --จาก-รหัส การเข้ารหัส
ตั้งค่าการเข้ารหัสดั้งเดิมของข้อมูลเป็น การเข้ารหัส.
-t, --to-รหัส การเข้ารหัส
แปลงข้อมูลเป็น การเข้ารหัส.
--add-ลายเซ็น
เพิ่มอักขระลายเซ็น U+FEFF Unicode (BOM) หากชุดอักขระเอาต์พุตรองรับ
และไม่ได้เพิ่มแต่อย่างใด
--ลบ-ลายเซ็น
ลบอักขระลายเซ็น U+FEFF Unicode (BOM)
-o, --เอาท์พุท ไฟล์
เขียนข้อมูลที่แปลงเป็น ไฟล์.
คอลแบ็ค
ยูคอนวี รองรับการระบุการเรียกกลับเพื่อจัดการข้อมูลที่ไม่ถูกต้อง สามารถตั้งค่าการโทรกลับได้ทั้งคู่
ทิศทางของการแปลงรหัส: จากการเข้ารหัสดั้งเดิมเป็น Unicode ด้วย --จาก-โทรกลับ
ตัวเลือกและจาก Unicode ไปจนถึงการเข้ารหัสปลายทางด้วย --to-โทรกลับ ตัวเลือก
ต่อไปนี้เป็นรายการที่ถูกต้อง โทรกลับ ชื่อพร้อมกับคำอธิบายของพวกเขา
พฤติกรรม. รายการโทรกลับที่รองรับจริงโดย ยูคอนวี จะปรากฏขึ้นเมื่อมีการเรียก
สีสดสวย -h, --ช่วยด้วย.
แทน เขียนลำดับการแทนที่ของการเข้ารหัส หรือการแทนที่ Unicode
ตัวอักษร ยู+FFFD เมื่อแปลงรหัสเป็น Unicode
ข้าม ละเว้นข้อมูลที่ไม่ถูกต้อง
หยุด หยุดโดยมีข้อผิดพลาดเมื่อพบข้อมูลที่ไม่ถูกต้อง นี่คือค่าเริ่มต้น
โทรกลับ.
หลบหนี เหมือนกับ หนี-icu.
หนี-icu แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ %Uhhhh สำหรับ
เครื่องบิน 0 ตัวอักษรและ %Uhhhh%Uhhhh สำหรับเครื่องบิน 1 ขึ้นไป อักขระ
ที่ไหน hhhh เป็นค่าเลขฐานสิบหกของหนึ่งในหน่วยรหัส UTF-16
เป็นตัวแทนของตัวละคร ตัวละครจากเครื่องบิน 1 ขึ้นไปคือ
เขียนเป็นคู่ของหน่วยรหัสตัวแทน UTF-16
หนี-java แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ \uhhhh สำหรับ
เครื่องบิน 0 ตัวอักษรและ \uhhhh\uhhhh สำหรับเครื่องบิน 1 ขึ้นไป อักขระ
ที่ไหน hhhh เป็นค่าเลขฐานสิบหกของหนึ่งในหน่วยรหัส UTF-16
เป็นตัวแทนของตัวละคร ตัวละครจากเครื่องบิน 1 ขึ้นไปคือ
เขียนเป็นคู่ของหน่วยรหัสตัวแทน UTF-16
หนี-c แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ \uhhhh สำหรับ
เครื่องบิน 0 ตัวอักษรและ \Uหึหึ สำหรับเครื่องบิน 1 ขึ้นไป อักขระ
ที่ไหน hhhh และ หึหึ เป็นค่าเลขฐานสิบหกของ Unicode
โค้ดพอยท์
หนี-xml เหมือนกับ หนี-xml-hex.
หนี-xml-hex แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ &#NShhhh;,
ที่ไหน hhhh คือค่าเลขฐานสิบหกของจุดโค้ด Unicode
Escape-xml-dec แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ &#NNNN;ที่นี่มี
NNNN คือค่าทศนิยมของจุดโค้ด Unicode
หนี-unicode แทนที่อักขระที่ขาดหายไปด้วยสตริงของรูปแบบ {ยู+hhhh},
ที่ไหน hhhh คือค่าเลขฐานสิบหกของจุดโค้ด Unicode ที่
สตริงเลขฐานสิบหกมีความยาวผันแปรได้และสามารถใช้ได้ตั้งแต่ 4 ถึง 6 หลัก
นี่คือรูปแบบที่ใช้กันทั่วไปเพื่อแสดงถึงจุดโค้ด Unicode ใน
ครอก คั่นด้วยวงเล็บปีกกาเพื่อให้จดจำได้ง่าย
การแทนที่ในผลลัพธ์
ตัวอย่าง
แปลงข้อมูลจากที่กำหนด การเข้ารหัส ไปที่การเข้ารหัสแพลตฟอร์ม:
$ ยูคอนวี -f การเข้ารหัส
ตรวจสอบว่า a ไฟล์ มีข้อมูลที่ถูกต้องสำหรับที่กำหนด การเข้ารหัส:
$ ยูคอนวี -f การเข้ารหัส -c ไฟล์ > / dev / null
แปลง UTF-8 ไฟล์ ให้ การเข้ารหัส และให้แน่ใจว่าข้อความผลลัพธ์นั้นดีสำหรับ
HTML เวอร์ชันใดก็ได้:
$ ยูคอนวี -f UTF-8 -t การเข้ารหัส
--โทรกลับ Escape-xml-dec ไฟล์
แสดงชื่อของจุดโค้ด Unicode ในไฟล์ UTF:
$ ยูคอนวี -f UTF-8 -x ชื่อใดก็ได้ ไฟล์
พิมพ์ชื่อจุดโค้ด Unicode ที่ทราบค่า (ยู+30เอบี ในตัวอย่างนี้):
$ เสียงสะท้อน '\u30ab' | ยูคอนวี -x 'เลขฐานสิบหก-ใดๆ; ชื่ออะไรก็ได้'; เสียงสะท้อน
{KATAKANA จดหมาย KA}{LINE FEED}
$
(ชื่อคั่นด้วยเครื่องหมายวงเล็บปีกกา นอกจากนี้ ชื่อของตัวต่อสายยังเป็น
แสดง)
ทำให้ข้อมูล UTF-8 เป็นปกติโดยใช้ Unicode NFKC ลบอักขระควบคุมทั้งหมด และแมป Katakana
ไปฮิรางานะ:
$ ยูคอนวี -f UTF-8 -t UTF-8
-x '::nfkc; [:สำเนา:] >; ::คะตะคะนะ-ฮิระงะนะ;'
คำเตือน AND ข้อบกพร่อง
ยูคอนวี ไม่รายงานข้อผิดพลาดที่เกิดขึ้นที่ไบต์ที่ไม่ถูกต้องแรกพบ นี่อาจจะเป็น
สร้างความสับสนให้กับผู้ใช้ GNU iconv(1) ซึ่งรายงานข้อผิดพลาดที่เกิดขึ้นที่ไบต์แรกของ
ลำดับที่ไม่ถูกต้อง สำหรับชุดอักขระหรือการเข้ารหัสแบบหลายไบต์ หมายความว่า ยูคอนวี
ตำแหน่งข้อผิดพลาดอาจอยู่ที่ออฟเซ็ตภายหลังในสตรีมอินพุตมากกว่าที่จะเป็น
GNU iconv(1)
การรายงานตำแหน่งข้อผิดพลาดเมื่อใช้ตัวทับศัพท์อาจไม่ถูกต้องหรือ
ไม่พร้อมใช้งานซึ่งในกรณีนี้ ยูคอนวี จะรายงานออฟเซ็ตในกระแสเอาต์พุตที่
เกิดข้อผิดพลาด
ผู้เขียน
โจนัส อุตเตอร์สตรอม
อีฟ อาร์รูเย
VERSION
55.1
ลิขสิทธิ์
ลิขสิทธิ์ (C) 2000-2005 IBM, Inc. และอื่นๆ
ใช้ uconv ออนไลน์โดยใช้บริการ onworks.net