أداة تحويل الترميز يونيكود

الأسئلة الشائعة

ما هو اليونيكود؟

اليونيكود هو معيار ترميز عالمي يخصص رمزًا فريدًا لكل حرف، بغض النظر عن المنصة أو البرنامج أو اللغة.

لماذا اليونيكود مهم؟

يضمن اليونيكود ترميزًا متسقًا وتمثيلًا ومعالجة للنصوص، مما يتيح التواصل السلس وتبادل البيانات عبر الأنظمة واللغات المختلفة.

كيف أستخدم اليونيكود؟

يمكنك استخدام اليونيكود عن طريق الإشارة إلى نقاط الكود في تطبيقاتك أو باستخدام أدوات تدعم ترميز اليونيكود.

كيف يعمل اليونيكود؟

يخصص اليونيكود قيمة رقمية فريدة، تسمى نقطة كود، لكل حرف. تُكتب نقاط الكود بتنسيق "U+XXXX"، حيث "XXXX" هو رقم سداسي عشري. على سبيل المثال، نقطة الكود للحرف "A" هي U+0041.

ما هي كتل اليونيكود؟

ينظم اليونيكود الأحرف في كتل بناءً على نصوصها أو استخدامها. على سبيل المثال، تحتوي كتلة "اللاتينية الأساسية" على أحرف تستخدم في اللغة الإنجليزية، بينما تحتوي كتلة "الرموز المتحدة للصينية واليابانية والكورية" على أحرف صينية ويابانية وكورية.

ما هو UTF-8 وما علاقته باليونيكود؟

UTF-8 هو ترميز حرفي متغير الطول لليونيكود. يشفر كل حرف يونيكود كبايت واحد إلى أربعة بايتات، مما يجعله فعالاً للنصوص التي تستخدم أحرف ASCII بشكل أساسي مع دعم جميع أحرف اليونيكود.

كيفية تحويل النص إلى يونيكود في لغات البرمجة المختلفة؟

فيما يلي أمثلة لتحويل النص إلى يونيكود في لغات برمجة مختلفة.

Java

String text = "A";
String unicode = String.format("\\u%04x", (int) text.charAt(0));
System.out.println(unicode); // Output: \u0041

PHP

$text = "A";
$unicode = sprintf("\\u%04x", ord($text));
echo $unicode; // Output: \u0041

Go

package main

import (
	"fmt"
)

func main() {
	text := "A"
	unicode := fmt.Sprintf("\\u%04x", text[0])
	fmt.Println(unicode) // Output: \u0041
}

C

#include <stdio.h>

int main() {
    char text = 'A';
    printf("\\u%04x\\n", text); // Output: \u0041
    return 0;
}

JavaScript

const text = "A";
const unicode = "\\u" + text.charCodeAt(0).toString(16).padStart(4, "0");
console.log(unicode); // Output: \u0041

TypeScript

const text: string = "A";
const unicode: string = "\\u" + text.charCodeAt(0).toString(16).padStart(4, "0");
console.log(unicode); // Output: \u0041

Python

text = "A"
unicode = f"\\u{ord(text):04x}"
print(unicode)  # Output: \u0041