UTF-8 இருந்து Hex க்கு மாற்றும் கருவி

அடிக்கடி கேட்கப்படும் கேள்விகள்

UTF-8 குறியாக்கம் என்ன?

UTF-8 என்பது யூனிகோடு குறியாக்கத்திற்கு ஒரு மாறுபட்ட நீளமான குறியாக்கமாகும். இது 1 முதல் 4 பைட்டுகளுக்கு இடையே பயன்படும், எனவே ASCII எழுத்துக்களை குறியாக்குவதில் திறமையானது மற்றும் அனைத்து யூனிகோடு எழுத்துக்களையும் ஆதரிக்கின்றது.

இந்த கருவி உரையை UTF-8 ஆக எவ்வாறு மாற்றுகிறது?

இந்த கருவி உள் உரையை UTF-8 ஆக குறியாக்க செய்யும் TextEncoder பயன்பாட்டை பயன்படுத்துகிறது. ஒவ்வொரு எழுத்துக்கும், அது தனது Unicode குறியீட்டு புள்ளி அடிப்படையில் 1 அல்லது 2 அல்லது 3 பைட்டுகளுக்கு மாற்றப்படும்.

இந்த கருவி UTF-8 ஐ உரையாக எவ்வாறு மாற்றுகிறது?

இந்த கருவி UTF-8 ஆல் குறியாக்கப்பட்ட பைட்டுகளை தேவைப்படும் எழுத்துக்களாக மாற்றும் TextDecoder பயன்பாட்டை பயன்படுத்துகிறது. UTF-8 பைட்டுகள் பிரிக்கப்பட்ட பின்பு, அவை தங்கள் அசல் எழுத்துக்களாக மாற்றப்படுகின்றன.

ஏன் UTF-8 மிகவும் பிரபலமாக பயன்படுத்தப்படுகிறது?

UTF-8 ஆனது ASCII உடன் ஏற்புடையது, ஆங்கிலத்தில் எழுத்துக்களை குறியாக்குவதில் திறமையானது, மேலும் அனைத்து Unicode எழுத்துக்களையும் குறியாக்கம் செய்ய முடியும். இது இணைய பக்கங்களுக்கும் பல பிற கணினி அமைப்புகளுக்கும் டிபால்ட் குறியாக்கமாக உள்ளது.

UTF-8 குறியாக்கத்தின் அடிப்படை விதிமுறைகள் என்ன?

UTF-8 குறியாக்கம், Unicode குறியீட்டு புள்ளிகளை குழுமமாக்கி, அவற்றை பைட்டுகளாக குறியாக்கம் செய்கிறது.

  • U+0000 முதல் U+007F வரை உள்ள குறியீட்டு புள்ளிகள் ஒரே பைட்டில் குறியாக்கம் செய்யப்படுகின்றன (ASCII உடன் ஏற்புடைய).
  • U+0080 முதல் U+07FF வரை உள்ள குறியீட்டு புள்ளிகள் இரண்டு பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.
  • U+0800 முதல் U+FFFF வரை உள்ள குறியீட்டு புள்ளிகள் மூன்று பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.
  • U+10000 முதல் U+10FFFF வரை உள்ள குறியீட்டு புள்ளிகள் நான்கு பைட்டுகளில் குறியாக்கம் செய்யப்படுகின்றன.

ஒவ்வொரு பைட்டும் தனது இடத்தை குறிக்க குறிப்பிட்ட பிட்டுகள் கொண்டுள்ளது, இதன் மூலம் UTF-8 தானாகவே திரும்பிப்பார்க்கக்கூடியது மற்றும் பிழைகளுக்கு எதிர்ப்பு காட்டுகிறது.

வேறு ப்ரோகிராமிங் மொழிகளில் UTF-8 மாற்றம் எவ்வாறு செய்யலாம்?

இந்த உள்ளடக்கம் UTF-8 குறியாக்கம் மற்றும் பரிமாற்றத்திற்கு உதவும் உதாரணங்களை வழங்குகிறது:

Go

Go உதாரணம்: UTF-8 குறியாக்கம்.


import "fmt"

func main() {
    text := "Hello, World!"
    // Encode string to UTF-8 bytes
    utf8Bytes := []byte(text)
    fmt.Printf("UTF-8 bytes: %x\n", utf8Bytes)

    // Decode UTF-8 bytes back to string
    decodedText := string(utf8Bytes)
    fmt.Printf("Decoded text: %s\n", decodedText)
}
      
Java

Java உதாரணம்: UTF-8 குறியாக்கம்.


import java.nio.charset.StandardCharsets;

public class Utf8Example {
    public static void main(String[] args) {
        String text = "Hello, World!";
        // Encode string to UTF-8 bytes
        byte[] utf8Bytes = text.getBytes(StandardCharsets.UTF_8);
        System.out.println("UTF-8 bytes: " + java.util.Arrays.toString(utf8Bytes));

        // Decode UTF-8 bytes back to string
        String decodedText = new String(utf8Bytes, StandardCharsets.UTF_8);
        System.out.println("Decoded text: " + decodedText);
    }
}
      
Python

Python உதாரணம்: UTF-8 குறியாக்கம்.


text = "Hello, World!"
# Encode string to UTF-8 bytes
utf8_bytes = text.encode("utf-8")
print(f"UTF-8 bytes: {utf8_bytes}")

# Decode UTF-8 bytes back to string
decoded_text = utf8_bytes.decode("utf-8")
print(f"Decoded text: {decoded_text}")
      
PHP

PHP உதாரணம்: UTF-8 குறியாக்கம்.


<?php
$text = "Hello, World!";
// Encode string to UTF-8 bytes
$utf8Bytes = utf8_encode($text);
echo "UTF-8 bytes: " . bin2hex($utf8Bytes) . PHP_EOL;

// Decode UTF-8 bytes back to string
$decodedText = utf8_decode($utf8Bytes);
echo "Decoded text: " . $decodedText . PHP_EOL;
?>
      
JavaScript

JavaScript உதாரணம்: UTF-8 குறியாக்கம்.


const text = "Hello, World!";
// Encode string to UTF-8 bytes
const encoder = new TextEncoder();
const utf8Bytes = encoder.encode(text);
console.log("UTF-8 bytes:", Array.from(utf8Bytes));

// Decode UTF-8 bytes back to string
const decoder = new TextDecoder("utf-8");
const decodedText = decoder.decode(utf8Bytes);
console.log("Decoded text:", decodedText);
      
TypeScript

TypeScript உதாரணம்: UTF-8 குறியாக்கம்.


const text: string = "Hello, World!";
// Encode string to UTF-8 bytes
const encoder: TextEncoder = new TextEncoder();
const utf8Bytes: Uint8Array = encoder.encode(text);
console.log("UTF-8 bytes:", Array.from(utf8Bytes));

// Decode UTF-8 bytes back to string
const decoder: TextDecoder = new TextDecoder("utf-8");
const decodedText: string = decoder.decode(utf8Bytes);
console.log("Decoded text:", decodedText);