Häufig gestellte Fragen
Was ist TOON (Token-Oriented Object Notation)?
TOON (Token-Oriented Object Notation) ist ein kompaktes, menschenlesbares Daten-Serialisierungsformat, das speziell für Large Language Model (LLM) Anwendungen entwickelt wurde. Es wurde erstellt, um die wachsenden Token-Verbrauchskosten bei der Arbeit mit KI-Modellen wie ChatGPT, Claude, Gemini und anderen LLMs zu adressieren. TOON bietet eine schema-bewusste Alternative zu JSON, die den Token-Verbrauch um 30-50% oder mehr reduzieren kann.
Warum sollte ich TOON statt JSON für LLM-Prompts verwenden?
Es gibt mehrere überzeugende Gründe, TOON gegenüber JSON bei der Arbeit mit Large Language Models zu bevorzugen. Erstens die Kostenreduzierung - LLM-APIs wie OpenAIs GPT-4, Anthropics Claude und Googles Gemini berechnen basierend auf Token-Verbrauch, und TOON kann Ihren Token-Verbrauch für strukturierte Daten um 30-50% reduzieren.
Wie funktioniert das TOON-Format?
TOON funktioniert, indem es repetitive JSON-Strukturen in eine effizientere tabellarische Darstellung transformiert. Die Schlüsselerkenntnis ist, dass JSON bei einem Array von Objekten mit denselben Eigenschaften alle Eigenschaftsnamen für jedes einzelne Objekt wiederholt. TOON eliminiert diese Redundanz, indem das Schema einmal in einer Header-Zeile deklariert wird.
// JSON (89 characters)
[{"id":1,"name":"Alice"},{"id":2,"name":"Bob"}]
// TOON (42 characters, 53% smaller)
[2](id,name):
1,Alice
2,BobWas sind die Hauptunterschiede zwischen TOON und JSON?
Während sowohl TOON als auch JSON Daten-Serialisierungsformate sind, haben sie grundlegende Unterschiede in ihrem Ansatz und ihren Anwendungsfällen. JSON verwendet eine ausführliche Schlüssel-Wert-Paar-Syntax, bei der jedes Objekt explizit alle seine Eigenschaften benennt. TOON verwendet einen Schema-First-Ansatz, bei dem Eigenschaftsnamen einmal im Header deklariert werden.
Wie viel Token-Einsparung kann ich mit TOON erwarten?
Die Token-Einsparungen durch TOON variieren je nach Datenstruktur, aber typische Einsparungen liegen bei 30% bis 60% für strukturierte Daten mit wiederholten Schemas. Die Einsparungen sind am dramatischsten, wenn Sie Arrays mit vielen Objekten haben, die dieselben Eigenschaften teilen.
Was ist die grundlegende Syntax des TOON-Formats?
Die TOON-Syntax ist minimal, aber ausdrucksstark gestaltet. Die grundlegenden Bausteine sind: 1) Einfache Schlüssel-Wert-Paare werden als 'key: value' in separaten Zeilen geschrieben. 2) Arrays von Objekten verwenden eine Header-Notation: 'arrayName[count](field1,field2,field3):' gefolgt von Datenzeilen.
// Array with schema header
products[3](id,name,price):
1,Widget,9.99
2,Gadget,19.99
3,Gizmo,29.99
// Nested object
user:
name: John Doe
age: 30
address:{city: New York, zip: 10001}Welche Datentypen unterstützt TOON?
TOON unterstützt alle gleichen Datentypen wie JSON und gewährleistet vollständige Datentreue während der Konvertierung. Strings werden als Text dargestellt, Anführungszeichen sind nur erforderlich, wenn der String Sonderzeichen enthält. Zahlen umfassen sowohl Ganzzahlen als auch Fließkommazahlen.
Wie verwende ich das TOON-Format mit ChatGPT, Claude und anderen LLMs?
Die Verwendung von TOON mit LLMs ist unkompliziert und folgt einem 'zeigen statt erzählen'-Ansatz. Die effektivste Methode ist, Ihre TOON-Daten in Code-Blöcke mit dem 'toon'-Sprachidentifikator zu verpacken.
// LLM Prompt Example:
Here is user data in TOON format:
users[3](id,name,email):
1,Alice,[email protected]
2,Bob,[email protected]
3,Charlie,[email protected]
Please analyze this data and respond in the same TOON format.Welche Programmiersprachen unterstützen TOON?
TOON hat wachsende Unterstützung in vielen Programmiersprachen mit sowohl offiziellen als auch Community-Implementierungen. Die offizielle TypeScript/JavaScript-Implementierung (toon-format/toon auf npm) ist die Referenzimplementierung. Python-Entwickler können das toon_format-Paket von PyPI verwenden.
Wann sollte ich TOON verwenden und wann bei JSON bleiben?
TOON ist ideal für bestimmte Szenarien, während JSON für andere besser geeignet bleibt. Verwenden Sie TOON, wenn: 1) Sie strukturierte Daten an LLMs senden und Token-Kosten reduzieren möchten. 2) Sie Arrays von Objekten mit konsistenten Schemas haben. Bleiben Sie bei JSON, wenn: 1) Sie mit Konfigurationsdateien arbeiten, die Menschen häufig bearbeiten.
Was sind die Einschränkungen des TOON-Formats?
Obwohl TOON erhebliche Vorteile bietet, ist es wichtig, seine Einschränkungen zu verstehen. Erstens ist TOON für Arrays von Objekten mit konsistenten Schemas optimiert - für einzelne Objekte oder sehr unregelmäßige Strukturen sind die Token-Einsparungen minimal.
Was sind Best Practices für die Verwendung von TOON mit LLMs?
Um die Vorteile von TOON bei der Arbeit mit LLMs zu maximieren, befolgen Sie diese Best Practices: 1) Validieren Sie immer Ihr JSON vor der Konvertierung zu TOON. 2) Verwenden Sie Code-Blöcke mit dem 'toon'-Sprachidentifikator. 3) Für komplexe Schemas geben Sie ein kleines Beispiel in Ihrem System-Prompt.