அடிக்கடி கேட்கப்படும் கேள்விகள்
UTF-8 குறியாக்கம் என்ன?
UTF-8 என்பது யூனிகோடு குறியாக்கத்திற்கு ஒரு மாறுபட்ட நீளமான குறியாக்கமாகும். இது 1 முதல் 4 பைட்டுகளுக்கு இடையே பயன்படும், எனவே ASCII எழுத்துக்களை குறியாக்குவதில் திறமையானது மற்றும் அனைத்து யூனிகோடு எழுத்துக்களையும் ஆதரிக்கின்றது.
இந்த கருவி உரையை UTF-8 ஆக எவ்வாறு மாற்றுகிறது?
இந்த கருவி உள் உரையை UTF-8 ஆக குறியாக்க செய்யும் TextEncoder பயன்பாட்டை பயன்படுத்துகிறது. ஒவ்வொரு எழுத்துக்கும், அது தனது Unicode குறியீட்டு புள்ளி அடிப்படையில் 1 அல்லது 2 அல்லது 3 பைட்டுகளுக்கு மாற்றப்படும்.
இந்த கருவி UTF-8 ஐ உரையாக எவ்வாறு மாற்றுகிறது?
இந்த கருவி UTF-8 ஆல் குறியாக்கப்பட்ட பைட்டுகளை தேவைப்படும் எழுத்துக்களாக மாற்றும் TextDecoder பயன்பாட்டை பயன்படுத்துகிறது. UTF-8 பைட்டுகள் பிரிக்கப்பட்ட பின்பு, அவை தங்கள் அசல் எழுத்துக்களாக மாற்றப்படுகின்றன.
ஏன் UTF-8 மிகவும் பிரபலமாக பயன்படுத்தப்படுகிறது?
UTF-8 ஆனது ASCII உடன் ஏற்புடையது, ஆங்கிலத்தில் எழுத்துக்களை குறியாக்குவதில் திறமையானது, மேலும் அனைத்து Unicode எழுத்துக்களையும் குறியாக்கம் செய்ய முடியும். இது இணைய பக்கங்களுக்கும் பல பிற கணினி அமைப்புகளுக்கும் டிபால்ட் குறியாக்கமாக உள்ளது.
UTF-8 குறியாக்கத்தின் அடிப்படை விதிமுறைகள் என்ன?
UTF-8 குறியாக்கம், Unicode குறியீட்டு புள்ளிகளை குழுமமாக்கி, அவற்றை பைட்டுகளாக குறியாக்கம் செய்கிறது.
- U+0000 முதல் U+007F வரை உள்ள குறியீட்டு புள்ளிகள் ஒரே பைட்டில் குறியாக்கம் செய்யப்படுகின்றன (ASCII உடன் ஏற்புடைய).
- U+0080 முதல் U+07FF வரை உள்ள குறியீட்டு புள்ளிகள் இரண்டு பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.
- U+0800 முதல் U+FFFF வரை உள்ள குறியீட்டு புள்ளிகள் மூன்று பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.
- U+10000 முதல் U+10FFFF வரை உள்ள குறியீட்டு புள்ளிகள் நான்கு பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.
ஒவ்வொரு பைட்டும் தனது இடத்தை குறிக்க குறிப்பிட்ட பிட்டுகள் கொண்டுள்ளது, இதன் மூலம் UTF-8 தானாகவே திரும்பிப்பார்க்கக்கூடியது மற்றும் பிழைகளுக்கு எதிர்ப்பு காட்டுகிறது.
வேறு ப்ரோகிராமிங் மொழிகளில் UTF-8 மாற்றம் எவ்வாறு செய்யலாம்?
இந்த உள்ளடக்கம் UTF-8 குறியாக்கம் மற்றும் பரிமாற்றத்திற்கு உதவும் உதாரணங்களை வழங்குகிறது:
Go
Go உதாரணம்: UTF-8 குறியாக்கம்.
import "fmt"
func main() {
text := "Hello, World!"
// Encode string to UTF-8 bytes
utf8Bytes := []byte(text)
fmt.Printf("UTF-8 bytes: %x\n", utf8Bytes)
// Decode UTF-8 bytes back to string
decodedText := string(utf8Bytes)
fmt.Printf("Decoded text: %s\n", decodedText)
}
Java
Java உதாரணம்: UTF-8 குறியாக்கம்.
import java.nio.charset.StandardCharsets;
public class Utf8Example {
public static void main(String[] args) {
String text = "Hello, World!";
// Encode string to UTF-8 bytes
byte[] utf8Bytes = text.getBytes(StandardCharsets.UTF_8);
System.out.println("UTF-8 bytes: " + java.util.Arrays.toString(utf8Bytes));
// Decode UTF-8 bytes back to string
String decodedText = new String(utf8Bytes, StandardCharsets.UTF_8);
System.out.println("Decoded text: " + decodedText);
}
}
Python
Python உதாரணம்: UTF-8 குறியாக்கம்.
text = "Hello, World!"
# Encode string to UTF-8 bytes
utf8_bytes = text.encode("utf-8")
print(f"UTF-8 bytes: {utf8_bytes}")
# Decode UTF-8 bytes back to string
decoded_text = utf8_bytes.decode("utf-8")
print(f"Decoded text: {decoded_text}")
PHP
PHP உதாரணம்: UTF-8 குறியாக்கம்.
<?php
$text = "Hello, World!";
// Encode string to UTF-8 bytes
$utf8Bytes = utf8_encode($text);
echo "UTF-8 bytes: " . bin2hex($utf8Bytes) . PHP_EOL;
// Decode UTF-8 bytes back to string
$decodedText = utf8_decode($utf8Bytes);
echo "Decoded text: " . $decodedText . PHP_EOL;
?>
JavaScript
JavaScript உதாரணம்: UTF-8 குறியாக்கம்.
const text = "Hello, World!";
// Encode string to UTF-8 bytes
const encoder = new TextEncoder();
const utf8Bytes = encoder.encode(text);
console.log("UTF-8 bytes:", Array.from(utf8Bytes));
// Decode UTF-8 bytes back to string
const decoder = new TextDecoder("utf-8");
const decodedText = decoder.decode(utf8Bytes);
console.log("Decoded text:", decodedText);
TypeScript
TypeScript உதாரணம்: UTF-8 குறியாக்கம்.
const text: string = "Hello, World!";
// Encode string to UTF-8 bytes
const encoder: TextEncoder = new TextEncoder();
const utf8Bytes: Uint8Array = encoder.encode(text);
console.log("UTF-8 bytes:", Array.from(utf8Bytes));
// Decode UTF-8 bytes back to string
const decoder: TextDecoder = new TextDecoder("utf-8");
const decodedText: string = decoder.decode(utf8Bytes);
console.log("Decoded text:", decodedText);