Unicode 編碼轉換工具

常見問題

什麼是 Unicode?

Unicode 是一種通用字符編碼標準,它為每個字符分配一個唯一的代碼,不論是什麼平台、程式或語言。

為什麼 Unicode 很重要?

Unicode 確保文本的一致編碼、表示和處理,實現了不同系統和語言之間的無縫通信和數據交換。

如何使用 Unicode?

您可以通過在應用程式中引用其代碼點或使用支持 Unicode 編碼的工具來使用 Unicode。

Unicode 是如何工作的?

Unicode 為每個字符分配一個唯一的數值,稱為代碼點。這些代碼點以「U+XXXX」的格式書寫,其中「XXXX」是一個十六進制數。例如,字母「A」的代碼點是 U+0041。

什麼是 Unicode 區塊?

Unicode 根據文字或用途將字符組織成區塊。例如,「基本拉丁區」包含英語中使用的字符,而「中日韓統一表意文字區」包含中文、日文和韓文字符。

什麼是 UTF-8,它與 Unicode 有什麼關係?

UTF-8 是 Unicode 的一種可變長度字符編碼。它將每個 Unicode 字符編碼為一到四個位元組,這使得它對主要使用 ASCII 字符的文本來說非常高效,同時支持所有 Unicode 字符。

如何在不同的程式語言中將文本轉換為 Unicode?

以下是在各種程式語言中將文本轉換為 Unicode 的示例。

Java

String text = "A";
String unicode = String.format("\\u%04x", (int) text.charAt(0));
System.out.println(unicode); // Output: \u0041

PHP

$text = "A";
$unicode = sprintf("\\u%04x", ord($text));
echo $unicode; // Output: \u0041

Go

package main

import (
	"fmt"
)

func main() {
	text := "A"
	unicode := fmt.Sprintf("\\u%04x", text[0])
	fmt.Println(unicode) // Output: \u0041
}

C

#include <stdio.h>

int main() {
    char text = 'A';
    printf("\\u%04x\\n", text); // Output: \u0041
    return 0;
}

JavaScript

const text = "A";
const unicode = "\\u" + text.charCodeAt(0).toString(16).padStart(4, "0");
console.log(unicode); // Output: \u0041

TypeScript

const text: string = "A";
const unicode: string = "\\u" + text.charCodeAt(0).toString(16).padStart(4, "0");
console.log(unicode); // Output: \u0041

Python

text = "A"
unicode = f"\\u{ord(text):04x}"
print(unicode)  # Output: \u0041