Preguntas frecuentes
¿Qué es TOON (Token-Oriented Object Notation)?
TOON (Token-Oriented Object Notation) es un formato de serialización de datos compacto y legible por humanos, diseñado específicamente para aplicaciones de modelos de lenguaje grandes (LLM). Fue creado para abordar la creciente preocupación por los costos de consumo de tokens al trabajar con modelos de IA como ChatGPT, Claude, Gemini y otros LLM. TOON proporciona una alternativa consciente del esquema a JSON que puede reducir el uso de tokens en un 30-50% o más.
¿Por qué usar TOON en lugar de JSON para prompts de LLM?
Hay varias razones convincentes para usar TOON en lugar de JSON al trabajar con modelos de lenguaje grandes. Primero, la reducción de costos: las API de LLM como GPT-4 de OpenAI, Claude de Anthropic y Gemini de Google cobran según el uso de tokens, y TOON puede reducir tu consumo de tokens en un 30-50% para datos estructurados.
¿Cómo funciona el formato TOON?
TOON funciona transformando estructuras JSON repetitivas en una representación tabular más eficiente. La idea clave es que cuando tienes un array de objetos con las mismas propiedades, JSON repite todos los nombres de propiedades para cada objeto. TOON elimina esta redundancia declarando el esquema una sola vez en una línea de encabezado.
// JSON (89 characters)
[{"id":1,"name":"Alice"},{"id":2,"name":"Bob"}]
// TOON (42 characters, 53% smaller)
[2](id,name):
1,Alice
2,Bob¿Cuáles son las principales diferencias entre TOON y JSON?
Aunque tanto TOON como JSON son formatos de serialización de datos, tienen diferencias fundamentales en su enfoque y casos de uso. JSON usa una sintaxis verbosa de pares clave-valor donde cada objeto nombra explícitamente todas sus propiedades. TOON usa un enfoque schema-first donde los nombres de propiedades se declaran una vez en el encabezado.
¿Cuánto ahorro de tokens puedo esperar con TOON?
El ahorro de tokens con TOON varía según la estructura de tus datos, pero los ahorros típicos van del 30% al 60% para datos estructurados con esquemas repetidos. Los ahorros son más dramáticos cuando tienes arrays con muchos objetos que comparten las mismas propiedades.
¿Cuál es la sintaxis básica del formato TOON?
La sintaxis de TOON está diseñada para ser mínima pero expresiva. Los bloques de construcción básicos son: 1) Los pares clave-valor simples se escriben como 'clave: valor' en líneas separadas. 2) Los arrays de objetos usan una notación de encabezado: 'nombreArray[cuenta](campo1,campo2,campo3):' seguido de filas de datos.
// Array with schema header
products[3](id,name,price):
1,Widget,9.99
2,Gadget,19.99
3,Gizmo,29.99
// Nested object
user:
name: John Doe
age: 30
address:{city: New York, zip: 10001}¿Qué tipos de datos soporta TOON?
TOON soporta todos los mismos tipos de datos que JSON, asegurando fidelidad completa de datos durante la conversión. Las cadenas se representan como texto, las comillas solo son necesarias cuando la cadena contiene caracteres especiales. Los números incluyen tanto enteros como valores de punto flotante.
¿Cómo uso el formato TOON con ChatGPT, Claude y otros LLM?
Usar TOON con LLM es sencillo y sigue un enfoque de 'mostrar, no contar'. El método más efectivo es envolver tus datos TOON en bloques de código usando el identificador de lenguaje 'toon'.
// LLM Prompt Example:
Here is user data in TOON format:
users[3](id,name,email):
1,Alice,[email protected]
2,Bob,[email protected]
3,Charlie,[email protected]
Please analyze this data and respond in the same TOON format.¿Qué lenguajes de programación soportan TOON?
TOON tiene soporte creciente en muchos lenguajes de programación con implementaciones oficiales y de la comunidad. La implementación oficial de TypeScript/JavaScript (toon-format/toon en npm) es la implementación de referencia. Los desarrolladores de Python pueden usar el paquete toon_format de PyPI.
¿Cuándo usar TOON vs cuándo quedarse con JSON?
TOON es ideal para ciertos escenarios mientras que JSON sigue siendo mejor para otros. Usa TOON cuando: 1) Envías datos estructurados a LLM y quieres reducir costos de tokens. 2) Tienes arrays de objetos con esquemas consistentes. Quédate con JSON cuando: 1) Trabajas con archivos de configuración que los humanos editan frecuentemente.
¿Cuáles son las limitaciones del formato TOON?
Aunque TOON ofrece beneficios significativos, es importante entender sus limitaciones. Primero, TOON está optimizado para arrays de objetos con esquemas consistentes - para objetos únicos o estructuras muy irregulares, los ahorros de tokens son mínimos.
¿Cuáles son las mejores prácticas para usar TOON con LLM?
Para maximizar los beneficios de TOON al trabajar con LLM, sigue estas mejores prácticas: 1) Siempre valida tu JSON antes de convertir a TOON. 2) Usa bloques de código con el identificador de lenguaje 'toon'. 3) Para esquemas complejos, proporciona un pequeño ejemplo en tu prompt de sistema.