Perguntas frequentes
O que é TOON (Token-Oriented Object Notation)?
TOON (Token-Oriented Object Notation) é um formato de serialização de dados compacto e legível por humanos, projetado especificamente para aplicações de modelos de linguagem grandes (LLM). Foi criado para abordar a crescente preocupação com os custos de consumo de tokens ao trabalhar com modelos de IA como ChatGPT, Claude, Gemini e outros LLMs.
Por que usar TOON em vez de JSON para prompts de LLM?
Existem várias razões convincentes para usar TOON em vez de JSON ao trabalhar com modelos de linguagem grandes. Primeiro, redução de custos - APIs de LLM como GPT-4 da OpenAI, Claude da Anthropic e Gemini do Google cobram com base no uso de tokens, e TOON pode reduzir seu consumo de tokens em 30-50% para dados estruturados.
Como funciona o formato TOON?
TOON funciona transformando estruturas JSON repetitivas em uma representação tabular mais eficiente. A ideia-chave é que quando você tem um array de objetos com as mesmas propriedades, JSON repete todos os nomes de propriedades para cada objeto. TOON elimina essa redundância declarando o esquema uma única vez em uma linha de cabeçalho.
// JSON (89 characters)
[{"id":1,"name":"Alice"},{"id":2,"name":"Bob"}]
// TOON (42 characters, 53% smaller)
[2](id,name):
1,Alice
2,BobQuais são as principais diferenças entre TOON e JSON?
Embora TOON e JSON sejam formatos de serialização de dados, eles têm diferenças fundamentais em sua abordagem e casos de uso. JSON usa uma sintaxe verbosa de pares chave-valor onde cada objeto nomeia explicitamente todas as suas propriedades. TOON usa uma abordagem schema-first onde os nomes das propriedades são declarados uma vez no cabeçalho.
Quanta economia de tokens posso esperar com TOON?
A economia de tokens com TOON varia dependendo da estrutura dos seus dados, mas economias típicas variam de 30% a 60% para dados estruturados com esquemas repetidos.
Qual é a sintaxe básica do formato TOON?
A sintaxe TOON é projetada para ser mínima mas expressiva. Os blocos de construção básicos são: 1) Pares chave-valor simples são escritos como 'chave: valor' em linhas separadas. 2) Arrays de objetos usam uma notação de cabeçalho.
// Array with schema header
products[3](id,name,price):
1,Widget,9.99
2,Gadget,19.99
3,Gizmo,29.99
// Nested object
user:
name: John Doe
age: 30
address:{city: New York, zip: 10001}Quais tipos de dados o TOON suporta?
TOON suporta todos os mesmos tipos de dados que JSON, garantindo fidelidade completa dos dados durante a conversão.
Como uso o formato TOON com ChatGPT, Claude e outros LLMs?
Usar TOON com LLMs é simples e segue uma abordagem de 'mostrar, não contar'. O método mais eficaz é envolver seus dados TOON em blocos de código usando o identificador de linguagem 'toon'.
// LLM Prompt Example:
Here is user data in TOON format:
users[3](id,name,email):
1,Alice,[email protected]
2,Bob,[email protected]
3,Charlie,[email protected]
Please analyze this data and respond in the same TOON format.Quais linguagens de programação suportam TOON?
TOON tem suporte crescente em muitas linguagens de programação com implementações oficiais e da comunidade disponíveis.
Quando usar TOON vs quando ficar com JSON?
TOON é ideal para certos cenários enquanto JSON permanece melhor para outros. Use TOON quando: 1) Você está enviando dados estruturados para LLMs e quer reduzir custos de tokens. Fique com JSON quando: 1) Você está trabalhando com arquivos de configuração que humanos editam frequentemente.
Quais são as limitações do formato TOON?
Embora TOON ofereça benefícios significativos, é importante entender suas limitações. Primeiro, TOON é otimizado para arrays de objetos com esquemas consistentes.
Quais são as melhores práticas para usar TOON com LLMs?
Para maximizar os benefícios do TOON ao trabalhar com LLMs, siga estas melhores práticas: 1) Sempre valide seu JSON antes de converter para TOON. 2) Use blocos de código com o identificador de linguagem 'toon'.