คอมพิวเตอร์เทคโนโลยีสารสนเทศ

การเข้ารหัส "Unicode": ตัวมาตรฐานการเข้ารหัส

ผู้ใช้อินเทอร์เน็ตทุกคนในความพยายามที่จะตั้งค่าหนึ่งหรืออื่น ๆ ของการทำงานอย่างน้อยหนึ่งครั้งเห็นบนหน้าจอที่เขียน ในจดหมายลาติน คำว่า "Unicode." มันคืออะไรคุณจะได้เรียนรู้จากการอ่านบทความนี้

คำนิยาม

การเข้ารหัส "Unicode" - ตัวอักษรเข้ารหัสมาตรฐาน. มันได้รับการเสนอโดย Unicode อิงค์องค์กรที่ไม่แสวงหาผลกำไร ในปี 1991 มาตรฐานถูกออกแบบมาเพื่อนำมารวมกันจำนวนที่เป็นไปที่ใหญ่ที่สุดของประเภทที่แตกต่างกันของตัวอักษรในเอกสาร หน้าซึ่งก่อตั้งขึ้นบนพื้นฐานดังกล่าวประกอบด้วยตัวอักษรและตัวอักษรจากภาษาที่แตกต่างกัน (จากภาษารัสเซียเป็นภาษาเกาหลี) และสัญญาณทางคณิตศาสตร์ ในกรณีนี้ทั้งหมดของตัวละครในชุดอักขระที่จะแสดงได้โดยไม่มีปัญหาใด ๆ

เหตุผลในการสร้าง

กาลครั้งหนึ่งนานก่อนที่การปรากฏตัวของระบบเดียว "Unicode" การเข้ารหัสถูกเลือกขึ้นอยู่กับความชอบของผู้เขียนของเอกสารที่ ด้วยเหตุนี้มักจะอ่านเอกสารก็จำเป็นต้องใช้ตารางที่แตกต่างกัน บางครั้งก็มีความจำเป็นต้องทำหลายครั้งที่มากความซับซ้อนในชีวิตของผู้ใช้โดยเฉลี่ย ดังกล่าวแล้ววิธีการแก้ปัญหานี้ในปี 1991 ได้รับเชิญไป Unicode อิงค์เป็นองค์กรที่ไม่แสวงหาผลกำไรที่จะนำเสนอรูปแบบใหม่ของการเข้ารหัสอักขระ มันถูกออกแบบมาเพื่อรวมล้าสมัยและความหลากหลายของมาตรฐาน "Unicode" - การเข้ารหัสที่ ozvolila บรรลุคิดไม่ถึงในเวลา: การสร้างเครื่องมือที่สนับสนุนเป็นจำนวนมากของตัวอักษร ผลที่ได้เกินความคาดหวังจำนวนมาก - มีเอกสารพร้อมกันที่มีทั้งข้อความภาษาอังกฤษและรัสเซียละตินและนิพจน์ทางคณิตศาสตร์

แต่การสร้างการเข้ารหัสแบบครบวงจรนำโดยความจำเป็นในการแก้ไขจำนวนของปัญหาที่เกิดขึ้นเนื่องจากการที่หลากหลายของมาตรฐานที่มีอยู่แล้วในเวลานั้น ที่พบมากที่สุดของพวกเขา

  • เขียนภูติหรือ "พูดพล่อยๆ";
  • ข้อ จำกัด ของชุดตัวละคร;
  • ปัญหาเปลี่ยน codings;
  • การทำสำเนาตัวอักษร

Excursus ประวัติศาสตร์ขนาดเล็ก

ลองจินตนาการว่า 80 หลา ฮาร์ดแวร์คอมพิวเตอร์ไม่ได้เพื่อร่วมกันและมีรูปแบบที่แตกต่างจากวันนี้ ในขณะที่แต่ละ OS เป็นเอกลักษณ์และการกลั่นความต้องการเฉพาะของผู้ที่ชื่นชอบของทุกคน จำเป็นสำหรับการแลกเปลี่ยนข้อมูลจะถูกแปลงเป็นทุกอย่างทำใหม่เพิ่มเติม พยายามอ่านเอกสารที่สร้างขึ้นโดยระบบปฏิบัติการอื่นมักจะแสดงชุดแปลกของตัวละครและเกมจะเริ่มต้นด้วยการเข้ารหัส มันไม่เคยทำมันได้อย่างรวดเร็วและเอกสารบางครั้งจำเป็นไม่สามารถเปิดในหกเดือนและแม้กระทั่งในภายหลัง คนที่มักแลกเปลี่ยนข้อมูลสำหรับตัวเองสร้างตารางการแปลง และจากนั้นทำงานกับพวกเขาเผยให้เห็นรายละเอียดที่น่าสนใจ: จำเป็นที่จะต้องสร้างพวกเขาในสองทิศทาง "จากฉันใน" กลับมา ยี่ห้อดาษดื่นผกผันคอมพิวเตอร์เครื่องไม่สามารถหามันในคอลัมน์ทางด้านขวาของแหล่งที่มาและซ้าย - ผล แต่ไม่ได้ในทางกลับกัน. ถ้าคุณเห็นความจำเป็นในการใช้อักขระพิเศษใด ๆ ในเอกสารที่พวกเขาจะต้องมีการเพิ่มเป็นครั้งแรกและจากนั้นอีกและจะอธิบายให้พันธมิตรสิ่งที่เขาต้องการจะทำอย่างไรกับตัวละครเหล่านี้จะไม่กลายเป็น "พูดพล่อยๆ." และให้ไม่ลืมว่าทุกการเข้ารหัสมีการพัฒนาหรือใช้แบบอักษรของตัวเองซึ่งนำไปสู่การสร้างเป็นจำนวนมากของรายการที่ซ้ำกันในระบบปฏิบัติการ

ลองจินตนาการต่อไปว่าแบบอักษรบนหน้าเว็บที่คุณจะเห็น 10 ชิ้นเหมือน Times New Roman กับโน้ตเล็ก ๆ สำหรับ UTF-8, UTF-16, ANSI, UCS 2 ตอนนี้คุณเข้าใจว่าการพัฒนาของมาตรฐานสากลเป็นสิ่งจำเป็น?

"การก่อตั้งบรรพบุรุษของผู้สร้างของ"

ต้นกำเนิดของการสร้าง Unicode ที่จะพบในปี 1987 เมื่อ Dzho Bekker จากซีร็อกซ์พร้อมกับลีคอลลินส์และมาร์คเดวิสจากแอปเปิ้ลเริ่มงานวิจัยในด้านของการสร้างการปฏิบัติของชุดอักขระสากล ในเดือนสิงหาคมปี 1988 Dzho Bekker การเผยแพร่ร่างข้อเสนอสำหรับการสร้างระบบการเข้ารหัสระหว่างประเทศ 16 บิตหลายลิ้น

ไม่กี่เดือนต่อ Unicode ทำงานกลุ่มยังขยายไปถึงเคนและไมค์วิสต์เลอ Kernegana จาก RLG เกล็น Rayt ของ Sun Microsystems และอื่น ๆ อีกหลายผู้เชี่ยวชาญการเปิดใช้งานความสำเร็จของการทำงานในเบื้องต้นการก่อตัวของทั่วไปเข้ารหัสมาตรฐาน.

คำอธิบายทั่วไป

ยูนิโค้ดตามแนวคิดของสัญลักษณ์ ภายใต้คำนิยามนี้หมายถึงปรากฏการณ์ที่เป็นนามธรรมที่มีอยู่ในรูปแบบเฉพาะของการเขียนและตระหนักถึงอักษร A ( "การถ่ายภาพบุคคล" ของพวกเขา) ตัวละครแต่ละตัวจะได้รับใน "Unicode" รหัสเฉพาะที่เป็นมาตรฐานหน่วยโดยเฉพาะอย่างยิ่ง เช่นตัวอักษร B ยังเป็นภาษาอังกฤษและตัวอักษรรัสเซีย แต่มันสอดคล้องกับ Unicode 2 ตัวอักษรที่แตกต่างกัน พวกเขาอาจมีการแปลงเป็น ตัวพิมพ์เล็ก, t. อีซึ่งแต่ละอธิบายฐานข้อมูลที่สำคัญชุดของคุณสมบัติและชื่อเต็ม

ประโยชน์ของ Unicode

จากโคตรอื่น ๆ การเข้ารหัส "UNICODE" มีหุ้นมากของสัญญาณสำหรับตัวอักษร "เข้ารหัส" คือ ความจริงที่ว่าก่อนหน้าของเขามี 8 บิตที่ได้รับการสนับสนุนโดย 28 ตัวอักษร แต่การออกแบบใหม่ที่มีอยู่แล้ว 216 ตัวอักษรที่เป็นขั้นตอนยักษ์ไปข้างหน้า เข้ารหัสได้รับอนุญาตนี้เกือบทุกตัวอักษรที่มีอยู่และที่พบบ่อย

กับการถือกำเนิดของ "Unicode" ไม่ต้องใช้ตารางการแปลง A: เป็นมาตรฐานเดียวมันก็เมื่อตะกี้จำเป็นสำหรับพวกเขา ในทำนองเดียวกันพวกเขาได้จมลงในการให้อภัยและ "พูดพล่อยๆ" - มาตรฐานเดียวทำให้พวกเขาเป็นไปไม่ได้เช่นเดียวกับการออกกฎความจำเป็นในการสร้างแบบอักษรที่ซ้ำกัน

พัฒนา Unicode

แน่นอนความคืบหน้าไม่ได้อยู่ในสถานที่และตั้งแต่การนำเสนอครั้งแรกได้ผ่านไป 25 ปี อย่างไรก็ตาม charset "Unicode" หัวชนฝาช่วยให้ตำแหน่งในโลก ในหลาย ๆ วิธีนี้ได้รับการทำขอบคุณไปได้ที่จะมีความจริงที่ว่ามันได้กลายเป็นเรื่องง่ายที่จะใช้และมีการแพร่กระจาย, การเป็นที่ยอมรับของนักพัฒนาที่เป็นกรรมสิทธิ์ (จ่าย) และเปิดแหล่งซอฟต์แวร์

เราไม่ควรจะเชื่อว่าวันนี้เราจะเห็นรหัสเดียวกัน "Unicode" เป็นสี่ของศตวรรษที่ผ่านมา ในขณะที่มันถูกแทนที่ด้วยรุ่น 5.h.h และจำนวนของสัญลักษณ์รหัสได้เพิ่มขึ้น 231 ในความเป็นไปได้ของการใช้อัตรากำไรมากขึ้นเครื่องหมายปฏิเสธที่จะยังคงได้รับการสนับสนุน Unicode-16 (การเข้ารหัสที่จำนวนเงินสูงสุดของจำนวนที่ จำกัด ของพวกเขา 216) นับตั้งแต่ก่อตั้งขึ้นและถึงเวอร์ชั่น 2.0.0 "มาตรฐาน Unicode" ได้เพิ่มจำนวนของตัวละครว่ามันรวมอยู่ในเกือบ 2 เท่า โอกาสและการเจริญเติบโตอย่างต่อเนื่องในปีที่ผ่านมา สำหรับรุ่น 4.0.0 แล้วมีความจำเป็นที่จะเพิ่มมาตรฐานของตัวเองและที่ได้กระทำ เป็นผลให้ "Unicode" ได้พบรูปแบบที่เรารู้ว่าวันนี้

สิ่งอื่นที่อยู่ใน Unicode?

นอกจากนี้ยังมีกว้างใหญ่ปรับปรุงอย่างต่อเนื่องที่มีจำนวนของตัวละคร "Unicode" -Encoding ข้อมูลตัวอักษร เป็นอีกหนึ่งลักษณะที่มีประโยชน์ นี่คือสิ่งที่เรียกว่าการฟื้นฟู แทนที่จะเลื่อนผ่านตัวละครเอกสารทั้งหมดโดยตัวอักษรและไอคอนแทนของตารางการติดต่อให้ใช้หนึ่งในขั้นตอนวิธีการฟื้นฟูที่มีอยู่ มันคืออะไร?

แทนที่จะเสียทรัพยากรของคอมพิวเตอร์ในการตรวจสอบตามปกติของตัวละครเดียวกันซึ่งอาจจะคล้ายกันในตัวอักษรที่แตกต่างกันโดยใช้ขั้นตอนวิธีการพิเศษ มันช่วยให้คุณสามารถที่คล้ายสัญลักษณ์แยกต่างหากคอลัมน์การค้นหาตารางและนำไปใช้แล้วที่พวกเขาไม่ได้ซ้ำแล้วซ้ำอีกครั้งเพื่อทำการตรวจสอบข้อมูลทั้งหมด.

ขั้นตอนวิธีการดังกล่าวได้รับการพัฒนาและดำเนินการสี่ แต่ละแปลงจะเกิดขึ้นตามหลักการที่ชัดเจนอย่างเคร่งครัดที่แตกต่างจากที่อื่น ๆ เพื่อที่จะเรียกร้องใด ๆ หนึ่งของพวกเขาไม่ได้มีประสิทธิภาพมากที่สุด แต่ละคนได้รับการออกแบบสำหรับความต้องการที่เฉพาะเจาะจงได้รับการฝังตัวและใช้ประสบความสำเร็จ

มาตรฐานการเผยแพร่

ใน 25 ปีของประวัติศาสตร์การเข้ารหัส "UNICODE" ฉันได้รับอาจจะเป็นที่แพร่หลายมากที่สุดในโลก ภายใต้มาตรฐานนี้จะถูกปรับเป็นโปรแกรมและหน้าเว็บ ความกว้างของโปรแกรมอาจบ่งชี้ว่า Unicode ตอนนี้ใช้โดยกว่า 60% ของทรัพยากรอินเทอร์เน็ต

ตอนนี้คุณรู้ว่าเมื่อ "Unicode" มาตรฐานปรากฏ มันคืออะไรคุณก็รู้และสามารถที่จะชื่นชมความสำคัญอย่างเต็มรูปแบบของการประดิษฐ์ที่ทำโดยกลุ่มผู้เชี่ยวชาญ Unicode อิงค์ กว่า 25 ปีที่ผ่านมา

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 th.birmiss.com. Theme powered by WordPress.