Product & Architecture

A História de Skills: Quando a Infraestrutura Invisível Vira o Mercado

Uma investigação profunda sobre como tecnologias resolvem problemas que ninguém consegue nomear. De function calling a convergência de 16 plataformas.

32 min de leitura 29 abr 2026

Tecnologia é história vista de trás para frente. Você olha para um padrão dominante e ele parece inevitável. A solução óbvia. Mas no momento em que o problema foi formulado, havia cinco caminhos. Alguém escolheu um. Os outros quatro desapareceram da memória coletiva como se nunca tivessem existido. A história de Agent Skills é assim. Vou reconstruí-la não como tutorial. Como investigação. Uma jornada que começa com o que era óbvio e termina com o que permanece invisível, mesmo quando tudo está à vista.


I. A liturgia do problema sem nome

IA nunca foi sobre responder, sempre foi sobre agir. Quando o ChatGPT surgiu em novembro de 2022, ele conversava com uma eloquência estéril; era uma musa que não sabia segurar uma ferramenta. As organizações não queriam poemas, queriam assistentes que consultassem bancos, chamassem APIs e executassem código. Em junho de 2023, a OpenAI lançou o function calling, permitindo que modelos gerassem chamadas estruturadas em JSON a funções definidas pelo desenvolvedor. Foi celebrado como uma revolução, mas era apenas o início de uma fratura invisível entre a capacidade de fazer e o conhecimento sobre como fazer.

Há uma diferença silenciosa entre executar uma tarefa uma vez e possuir a expertise procedural para repeti-la sob variação. Um modelo com function calling executa uma query contra o Postgres, mas ele não “sabe” o banco; ele apenas segue um esquema. Se o schema muda, ou se a regra de negócio exige uma otimização que não cabe em um JSON estático, o sistema quebra. A expertise vive na cabeça do desenvolvedor e morre na sua saída. O function calling resolveu o atrito técnico, mas deixou intacto o vácuo ontológico: como transformar conhecimento procedural em algo que o modelo pudesse descobrir, usar e reutilizar sem a muleta de uma integração customizada.

Fratura técnica sem contexto

II. A física das tentativas paralelas

O que se seguiu foi uma sucessão de cercadinhos proprietários tentando capturar essa expertise. Em novembro de 2023, a OpenAI lançou os Custom GPTs, imaginando que o problema era o empacotamento. Instruções, arquivos e ações foram colocados em uma cela de 8 mil caracteres. Seis meses depois, o Google respondia com os Gems, replicando a mesma arquitetura de isolamento. Enquanto as Big Techs construíam muros, a Anthropic testava uma saída lateral. Em julho de 2024, os engenheiros David Soria Parra e Justin Spahr-Summers iniciaram o Model Context Protocol (MCP) como uma tentativa de resolver o problema M×N — conectar qualquer modelo a qualquer ferramenta através de um padrão, não de um produto.

Em novembro de 2024, o MCP foi lançado publicamente. Ele padronizou como os modelos se conectam a servidores de contexto, mas ainda deixava em aberto como codificar a inteligência sobre a ferramenta. Pouco tempo depois, o mercado assistiu à infraestrutura se dissolver.

Eficiência da padronização

III. A infraestrutura que se dissolve

Tecnologias que viram commodity param de ser discutidas. Ninguém mais pesquisa sobre TCP/IP ou se maravilha com a existência do HTTP; eles simplesmente funcionam na penumbra da realidade. O MCP entrou nessa zona de invisibilidade em agosto de 2025. O pico de interesse no Google Trends declinou não por falha, mas por sucesso absoluto: ele se dissolveu na paisagem como uma pintura de Dalí. Você não pesquisa mais o protocolo, você usa a ferramenta que o implementa. Mas exatamente quando a estrada ficou pronta, os veículos começaram a aparecer.

Em setembro de 2025, o Claude ganhou capacidades de criar documentos complexos — Excel, PowerPoint, PDF — de forma nativa. O que o mercado não sabia é que essa “mágica” era implementada via Agent Skills internas. Quando a Anthropic finalmente nomeou e abriu o padrão em dezembro, o jogo mudou de infraestrutura para expertise. Skills não são a estrada; são o motor. São o arquivo SKILL.md que carrega não apenas o “o que”, mas o “como” em camadas de descoberta progressiva.

IV. O contágio do padrão unificado

Em abril de 2026, dezesseis plataformas adotaram o mesmo padrão técnico. OpenAI Codex, Gemini, GitHub Copilot, Cursor, VS Code, Mistral Vibe e OpenClaw agora falam a mesma língua. Ninguém foi forçado, mas todos se renderam à aritmética da rede: o valor de um padrão é diretamente proporcional ao número de pessoas que não precisam pensar sobre ele para usá-lo. Quando a OpenAI escolhe adotar o formato da Anthropic para o Codex, ela admite que manter um diferencial proprietário é mais caro do que ganhar a guerra do uso.

A diferenciação migrou do “formato” para a “implementação”. Se todos usam o mesmo piso comum, você compete na qualidade da integração, na clareza da documentação e na utilidade do marketplace. Como Zygmunt Bauman sugeriria sobre a modernidade líquida, as estruturas fixas dos GPTs derreteram em prol da fluidez das Skills. O padrão deixou de ser uma vantagem competitiva para se tornar o oxigênio do ecossistema.

V. Timeline Visual da Evolução

Para compreender a velocidade dessa transformação, é preciso observar os marcos que definiram cada ciclo de desenvolvimento, desde a primeira chamada de função até a publicação do padrão aberto.

timeline
    title Evolução da Agência Artificial e Skills
    2022 : Nov : ChatGPT lançado (texto puro)
    2023 : Jun : OpenAI: Function calling GA para GPT-4
         : Nov : OpenAI: Custom GPTs (ecossistema fechado)
    2024 : Mai : Anthropic: Tool Use GA para Claude
         : Nov : Anthropic: MCP lançado como open standard
         : Dez : OpenAI anuncia suporte a MCP
    2025 : Set : Anthropic: Code Execution + Skills internas (pptx, xlsx, docx, pdf)
         : Out : ANTHROPIC: Agent Skills anunciado oficialmente (API skills-2025-10-02)
         : Dez : ANTHROPIC: Agent Skills publicado como OPEN STANDARD
    2026 : Jan : OpenAI Codex: adota formato SKILL.md
         : Mar : Gemini CLI e GitHub Copilot: suporte total a Agent Skills
         : Abr : 16+ plataformas suportam o padrão; 1.000+ skills no ecossistema

VI. A economia da atenção saliente

O custo real da IA nunca foi o volume de tokens, mas a dispersão da atenção. O function calling escalava mal porque inundava o modelo com ruído; passe cinquenta funções e a precisão da escolha despenca. Como um agente racional sobrecarregado, o modelo perdia a saliência. As Skills resolvem isso através do progressive disclosure: você não entrega tudo ao modelo, você entrega apenas o que importa no momento da ativação.

Essa arquitetura gerou uma economia estimada de 44% no consumo de tokens e elevou a taxa de acerto na primeira tentativa (first-pass accuracy) de 68% para 92% em fluxos complexos.

Poder do carregamento progressivo

Uma Skill é código destilado. Conhecimentos que ocupariam centenas de linhas de contexto são encapsulados em descrições curtas e gatilhos precisos. O modelo vê menos, mas decide melhor. É um princípio de design clássico: a rigidez das instruções gera o rigor da execução. Organizações que entenderem que a arquitetura do futuro exige especificidade vão escalar; as que continuarem tentando “vencer pelo volume” de contexto continuarão presas em modelos que “não funcionam direito”.

VII. A revelação do que permanece

A automação de tarefas procedurais não significa o fim das profissões, mas a revelação de onde o valor realmente mora. Um analista de dados em 2025 passava metade do seu tempo em queries de força bruta e limpeza de boilerplate. Em 2026, uma Skill faz isso. O valor do analista, então, é empurrado para cima na cadeia: ele não é mais o executor da query, ele é o formulador da pergunta. Ele é quem detém a intuição sobre o que a organização precisa saber e ainda não sabe que deseja.

Isso não é substituição, é a reconfiguração da essência profissional. O julgamento, a sensibilidade estética e a direção estratégica deixam de ser o que você faz “depois do trabalho chato” para se tornarem o trabalho integral. As Skills tiram o ruído e deixam apenas a música. Como toda tecnologia revolucionária, elas nascem no barulho, tornam-se invisíveis na utilidade e terminam como plataforma para algo que ainda não conseguimos nomear. O valor não some; ele apenas muda de endereço. E quem está ocupado observando o que desaparece raramente vê o que está nascendo sob seus pés.