คอมพิวเตอร์, การเขียนโปรแกรม
รหัส ASCII (รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล) - การเข้ารหัสข้อความพื้นฐานสำหรับอักษรละติน
ตามที่สหภาพโทรคมนาคมระหว่างประเทศในปี 2016 ทางอินเทอร์เน็ตที่มีมากขึ้นหรือน้อยใช้เป็นประจำสามและครึ่งพันล้านคน ส่วนใหญ่ของพวกเขาไม่ได้คิดเกี่ยวกับว่าข้อความที่ส่งถึงพวกเขาผ่านทางเครื่องคอมพิวเตอร์หรือโทรศัพท์มือถือแกดเจ็ตเช่นเดียวกับตำราที่ปรากฏบนจอภาพทุกชนิดในความเป็นจริงคือการรวมกันของ 0 และ 1 นี้เรียกว่าเป็นตัวแทนการเข้ารหัสข้อมูล มันมีและอำนวยความสะดวกในการดำเนินงานของการจัดเก็บข้อมูลการประมวลผลและการส่งผ่าน ในปี 1963, รหัส ASCII สหรัฐได้รับการพัฒนาซึ่งเป็นเรื่องของบทความนี้
การนำเสนอข้อมูลในคอมพิวเตอร์
ในแง่ของข้อความใด ๆ คอมพิวเตอร์อิเล็กทรอนิกส์เป็นคอลเลกชันของตัวละครแต่ละคน ในหมู่พวกเขาไม่เพียง แต่ตัวอักษรรวมทั้งเงินทุน แต่ยังเครื่องหมายวรรคตอนตัวเลข นอกจากนี้สัญลักษณ์พิเศษจะใช้ "=" "และ" "(" และช่องว่าง
ใหญ่ของสัญลักษณ์ที่ทำขึ้นข้อความที่เรียกว่าตัวอักษรและตัวเลข - พลังงาน (แสดงเป็น N) เพื่อตรวจสอบการแสดงออก N = 2 ^ ขที่ข - จำนวนบิตข้อมูลหรือสัญลักษณ์เฉพาะน้ำหนัก
มันพิสูจน์แล้วว่าพลังของ 256 ตัวอักษรช่วยให้คุณสามารถส่งทุกตัวอักษรที่จำเป็น
ตั้งแต่ 256 เป็น 8 ระดับสองแล้วน้ำหนักของตัวละครแต่ละตัวเป็น 8 บิต
หน่วยวัด 8 บิตจะเรียกว่า 1 ไบต์ดังนั้นเราจึงบอกว่ารหัสไบนารีของตัวละครใด ๆ ในข้อความที่ถูกเก็บไว้ในเครื่องคอมพิวเตอร์ของคุณหมกมุ่นอยู่กับหนึ่งไบต์ของหน่วยความจำ
เป็นวิธีการเข้ารหัส
ข้อความใด ๆ ที่เข้ามาในหน่วยความจำเครื่องคอมพิวเตอร์ผ่านแป้นคีย์บอร์ดตัวเลขที่ถูกเขียนตัวอักษรเครื่องหมายวรรคตอนและสัญลักษณ์อื่น ๆ ในความทรงจำที่พวกเขาจะถูกส่งใน รหัสไบนารี คือสัญลักษณ์แต่ละถูกแมปไปรหัสทศนิยมคุ้นเคยสำหรับคนที่ 0-255 ซึ่งสอดคล้องกับรหัสไบนารี - .. จาก 00000000-11111111
การเข้ารหัสอักขระไบต์ช่วยให้การประมวลผลดำเนินการประมวลผลของข้อความอ้างถึงตัวละครแต่ละตัวแยกกัน ในเวลาเดียวกัน, 256 ตัวอักษรก็เพียงพอที่จะแสดงข้อมูลตัวอักษรใด ๆ
การเข้ารหัสอักขระ ASCII
ย่อนี้ย่อมาจากรหัสมาตรฐานภาษาอังกฤษอเมริกันสำหรับการแลกเปลี่ยนข้อมูล
แม้ในยามเช้าของคอมพิวเตอร์มันก็เห็นได้ชัดว่ามันเป็นไปได้ที่จะเกิดขึ้นมีความหลากหลายของรูปแบบของข้อมูลที่เข้ารหัสด้วย อย่างไรก็ตามเพื่อให้การถ่ายโอนข้อมูลจากคอมพิวเตอร์เครื่องหนึ่งไปยังอีกที่ถูกต้องในการพัฒนามาตรฐานเดียว ดังนั้นในปี 1963 มีการ ASCII ตารางในสหรัฐอเมริกา มันใด ๆ ตัวอักษรคอมพิวเตอร์ตัวละครที่ได้รับมอบหมายหมายเลขลำดับในฐานเป็นตัวแทน ในขั้นต้นรหัส ASCII จะใช้เฉพาะในสหรัฐอเมริกาและต่อมาได้กลายเป็นมาตรฐานสากลสำหรับเครื่องคอมพิวเตอร์
สารบัญ
รหัส ASCII จะแบ่งออกเป็น 2 ส่วน มาตรฐานสากลถือว่าเป็นเพียงช่วงครึ่งแรกของตาราง ซึ่งจะรวมถึงโค้ดจากหมายเลขลำดับของ 0 (กำหนดเป็น 00000000) 127 (รหัส 01111111)
หมายเลขซีเรียล ยังไม่มีข้อความ | ข้อความ ASCII เข้ารหัส | สัญญลักษณ์ |
0-31 | 0000 0000 - 0001 1111 | ตัวอักษรที่มี N 0-31 จะเรียกว่าผู้จัดการ หน้าที่ของพวกเขาคือการ "คู่มือ" กระบวนการของการส่งออกข้อความไปยังจอภาพหรือพิมพ์อุปกรณ์เสียง beeping ฯลฯ |
32-127 | 0010 0000 - 0111 1111 | สัญลักษณ์กับ N 32-127 (ส่วนหนึ่งของมาตรฐานของตาราง) - ตัวอักษรพิมพ์ใหญ่และตัวพิมพ์เล็กของตัวอักษรละติน, หมายเลข 10 Nye เครื่องหมายวรรคตอนและวงเล็บต่างๆในเชิงพาณิชย์และตัวละครอื่น ๆ .. สัญลักษณ์ 32 บ่งชี้ว่าพื้นที่ |
128-255 | 1000 0000 - 1111 1111 | สัญลักษณ์กับ N 128-255 (เป็นส่วนหนึ่งทางเลือกของตารางหรือหน้ารหัส) สามารถมีความหลากหลายของตัวเลือกแต่ละที่มีหมายเลขของตัวเอง หน้ารหัสที่ใช้ในการกำหนดตัวอักษรแห่งชาติซึ่งมีความแตกต่างจากภาษาละติน โดยเฉพาะอย่างยิ่งจะดำเนินการด้วยความช่วยเหลือของรหัส ASCII สำหรับตัวอักษรรัสเซีย |
การเข้ารหัสโต๊ะพิมพ์ใหญ่และ ตัวพิมพ์เล็ก ที่ติดตามกันในลำดับตัวอักษรและตัวเลข - ค่าจากน้อยไปมาก หลักการนี้ถือสำหรับตัวอักษรรัสเซีย
ตัวควบคุม
ตารางการเข้ารหัส ASCII ได้รับการออกแบบมาสำหรับการรับและส่งข้อมูลเกี่ยวกับเรื่องนี้ไม่ได้ใช้โดยอุปกรณ์ที่เป็นโทรพิมพ์ ในเรื่องนี้ชุดอักขระรวมไม่พิมพ์ออกมาใช้เป็นคำสั่งในการควบคุมอุปกรณ์ คำสั่งดังกล่าวถูกนำมาใช้ในเทคนิคการส่งข้อความก่อนคอมพิวเตอร์ดังกล่าวเช่นรหัสมอร์สและอื่น ๆ
ที่พบมากที่สุด "โทรพิมพ์สัญลักษณ์" เป็น NUL (00 "ศูนย์") เขายังคงใช้มากที่สุดในการเขียนโปรแกรมภาษาแสดงให้เห็นสัญญาณของการสิ้นสุดของบรรทัดที่
ในกรณีที่การเข้ารหัส ASCII ใช้
รหัสมาตรฐานอเมริกันต้องไม่เพียง แต่แป้นพิมพ์ป้อนข้อความ นอกจากนี้ยังใช้ในแผนภูมิ โดยเฉพาะอย่างยิ่งภาพโปรแกรมศิลปะ ASCII ชงแทนส่วนขยายที่แตกต่างกันการเข้ารหัสอักขระ ASCII สเปกตรัม
ผลิตภัณฑ์เหล่านี้มาในสองประเภท: บรรณาธิการกราฟิกการปฏิบัติหน้าที่โดยการแปลงภาพเป็นข้อความและแปลง "รูปภาพ" ใน ASCII กราฟิก ยกตัวอย่างเช่นที่รู้จักกันเป็นตัวอย่างที่สำคัญยิ้มสัญลักษณ์การเข้ารหัส
ASCII สามารถนำมาใช้เมื่อมีการสร้างเอกสาร HTML ในกรณีนี้คุณสามารถป้อนชุดของตัวอักษรและสัญลักษณ์ที่สอดคล้องกับรหัสนี้จะปรากฏขึ้นเมื่อดูหน้าบนหน้าจอได้
ASCII เป็นสิ่งจำเป็นสำหรับการสร้างเว็บไซต์พูดได้หลายภาษาเป็นสัญญาณที่ไม่ได้อยู่ในตารางของชาติโดยเฉพาะอย่างยิ่งแทนที่ด้วย ASCII รหัส
คุณสมบัติบางอย่าง
การเข้ารหัสข้อมูลข้อความใน ASCII เดิมที่ใช้ 7 บิต (หนึ่งยังคงว่างเปล่า) แต่วันนี้เธอทำงานเป็น 8 บิต
ตัวอักษรซึ่งตั้งอยู่ในคอลัมน์ที่อยู่ด้านบนและด้านล่างแตกต่างจากคนอื่น ๆ โดยเฉพาะบิตเดียว นี้จะช่วยลดความซับซ้อนของการทดสอบ
แอพลิเคชัน ASCII ใน Microsoft Office
ถ้าจำเป็นประเภทของข้อมูลการเข้ารหัสข้อความนี้สามารถนำมาใช้ในการแก้ไขข้อความโดย Microsoft เช่น Notepad และ Office Word แต่เมื่อพิมพ์ในกรณีนี้คุณไม่สามารถใช้งานฟังก์ชั่นบางอย่าง ตัวอย่างเช่นคุณจะไม่สามารถที่จะดำเนินการเป็นตัวหนาอักขระ ASCII ยังคงมีเพียงความหมายของข้อมูลโดยไม่คำนึงถึงรูปร่างโดยรวมและแบบฟอร์ม
มาตรฐาน
องค์กรนำมาใช้มาตรฐาน ISO ISO 8859. กลุ่มนี้กำหนดเข้ารหัสแปดบิตสำหรับกลุ่มภาษาที่แตกต่าง โดยเฉพาะอย่างยิ่ง, ISO 8859-1 - เป็น ASCII ขยายซึ่งเป็นตารางสำหรับสหรัฐอเมริกาและยุโรปตะวันตก มาตรฐาน ISO 8859-5 - เป็นตารางที่ใช้สำหรับตัวอักษรซีริลลิรวมทั้งภาษารัสเซีย
ด้วยเหตุผลทางประวัติศาสตร์มาตรฐาน ISO 8859-5 มันถูกนำมาใช้เป็นเวลาสั้น ๆ
สำหรับภาษารัสเซียในขณะที่การเข้ารหัสที่ใช้จริง:
- CP866 (รหัสหน้า 866) หรือ DOS ซึ่งมักจะเรียกว่าการเข้ารหัสทางเลือก GOST มันถูกใช้อย่างแข็งขันจนถึงช่วงกลาง 90 โอบอุ้มของศตวรรษที่ผ่านมา ในขณะที่แทบไม่เคยใช้
- KOI-8 การเข้ารหัสได้รับการพัฒนาใน 1970-80s และในขณะที่มันเป็นมาตรฐานทั่วไปสำหรับข้อความอีเมลใน RuNet มันถูกใช้กันอย่างแพร่หลายในครอบครัว OS ระบบปฏิบัติการยูนิกซ์รวมถึงลินุกซ์ "รัสเซีย" รุ่นของ KOI-8 เรียกว่า KOI-8R นอกจากนี้ยังมีรุ่นสำหรับภาษาซีริลลิอื่น ๆ เช่นยูเครน
- หน้ารหัส 1251 (CP 1251, Windows - 1251) ที่พัฒนาโดยไมโครซอฟท์ให้การสนับสนุนสำหรับภาษารัสเซียในสภาพแวดล้อมของ Windows
ประโยชน์หลักของมาตรฐานแรก CP866 คือการรักษาตัวละครหลอกกราฟิกในตำแหน่งเดียวกับใน ASCII ขยาย นี้จะช่วยให้คุณสามารถเรียกใช้ข้อความที่ไม่เปลี่ยนแปลงของโปรแกรมการผลิตต่างประเทศที่มีชื่อเสียงเช่นนอร์ตันผู้บัญชาการ ณ จุดนี้ CP866 ใช้สำหรับโปรแกรมที่ออกแบบมาสำหรับ Windows ซึ่งทำงานในมุมมองข้อความแบบเต็มหน้าจอหรือในกล่องข้อความรวมทั้งใน FAR ผู้จัดการ
ตำราคอมพิวเตอร์เขียนในการเข้ารหัส CP866 เมื่อเร็ว ๆ นี้ค่อนข้างหายาก แต่มันจะใช้ชื่อไฟล์รัสเซียใน "Vindous"
"Unicode"
ในขณะที่แพร่หลายมากที่สุดคือการเข้ารหัสนี้ รหัส "Unicode" บนสนาม ครั้งแรก (จาก 0000 เพื่อ U + U + 007F) รวมถึงชุดของอักขระ ASCII ด้วยรหัส ตามด้วยตัวอักษรฟิลด์ของวรรณคดีแห่งชาติที่แตกต่างกันเช่นเดียวกับวรรคตอนและเทคนิคสัญลักษณ์ นอกจากนี้ยังเป็นส่วนหนึ่งของรหัส "Unicode" ถูกสงวนไว้ในกรณีที่มีความจำเป็นในการที่จะรวมถึงตัวละครใหม่ในอนาคต
ตอนนี้คุณรู้ว่าใน ASCII ตัวละครแต่ละตัวจะแสดงเป็นการรวมกันของ 8 ศูนย์และคน คนธรรมดาข้อมูลนี้อาจจะดูเหมือนไม่จำเป็นและไม่น่าทึ่ง แต่คุณไม่ต้องการที่จะรู้ว่าสิ่งที่เกิดขึ้น "ในสมอง" ของคอมพิวเตอร์ของคุณ!
Similar articles
Trending Now