Empresa fundada por Jonathan Ross (ex-Google, criou TPU). Especializada em chip de inferência de IA ultra-rápida (LPU — Language Processing Unit). Em set/2025 teve valuation X. Em dez/2025, NVIDIA pagou 3x esse valor. Sinal de mercado: inferência rápida virou commodity estratégica.

Qual a diferença entre GPU, TPU e LPU?

GPU (NVIDIA): processador originalmente para gráficos, dominante em treinamento de modelos. TPU (Google): otimizado para tensores, treinamento e inferência. LPU (Groq): otimizado para linguagem, foco em inferência ultra-rápida. Em 2026, conselheiro precisa entender essa diferenciação conceitualmente.

Por que isso afeta minha estratégia de IA?

Porque velocidade de inferência define UX de agentes. Agente que responde em 200ms é usável. Agente que responde em 5s é frustrante. Quem entende a infraestrutura por trás escolhe melhor o stack — e negocia melhor com fornecedores.

C-level precisa saber tecnicamente sobre chips?

Não tecnicamente. Conceitualmente. Conseguir conversar sobre 'inferência vs treinamento', 'latência vs throughput', 'cloud vs edge', 'GPU vs LPU' em reunião de board. Sem isso, decisões caras são tomadas sem fundamento.

Como aprendo isso sem virar técnico?

Mínimo: 1h/semana lendo announcements oficiais de NVIDIA, Anthropic, OpenAI, Google. 1h/semana hands-on com ferramentas. Em 90 dias você consegue conversar de igual com seu CTO sobre infraestrutura de IA. Mais sobre rotina semanal em Sharpening the Axe.

NVIDIA fecha US$ 20bi com Groq — e seu C-level deveria saber o que isso significa

Em dezembro de 2025, NVIDIA pagou 3x o último valuation da Groq. Mídia tech repercutiu. Conselheiro brasileiro médio leu a manchete e passou adiante. Erro estratégico — porque esse deal muda o stack de IA dos próximos 5 anos.

"NVIDIA fecha acordo de US$ 20 bilhões com a Groq ('compra' por 3x o último valuation de set/25) e você, conselheiro e/ou CEO não tem ideia da importância disso para o seu negócio. E não... isso não é coisa de TI. Conseguir entender conceitualmente (não tecnicamente) sobre GPU, TPU, LPU... ajuda a conversar sobre a estratégia de IA. Esse é a prova do Analfabetismo Estrutural em IA."

— Paulo Castello, dezembro de 2025

O deal que pegou parte do mercado de surpresa

NVIDIA é dona absoluta de chips para treinar modelos de IA. Suas GPUs (H100, B100, H200) são commodity premium do setor. Mas em inferência ultra-rápida — fazer modelos já treinados responderem em milissegundos — havia uma desafiante incômoda: a Groq, fundada por Jonathan Ross (ex-Google, criador do TPU).

A Groq desenvolveu a LPU (Language Processing Unit) — chip especializado em inferência de linguagem, com latência absurdamente baixa. Em demonstração pública, modelo rodando em Groq respondia 10x mais rápido que mesmo modelo em GPU.

Para a NVIDIA, ter concorrente forte em inferência (que vai virar o maior mercado de hardware de IA nos próximos 5 anos) era ameaça estratégica. Em dezembro/2025, fechou o deal: US$ 20 bilhões. Três vezes o último valuation da Groq de setembro do mesmo ano.

Mensagem para o mercado: inferência rápida é tão estratégica que vale 3x premium para garantir controle.

Por que isso não é "coisa de TI"

Conselheiro ou CEO que lê essa notícia e passa adiante está em Analfabetismo Estrutural em IA. Tema explicado em detalhe no autoteste de 10 perguntas.

Por que importa para você, mesmo não sendo engenheiro?

1. Velocidade de inferência = UX de agente

Agente que responde em 200ms é usável. Agente que responde em 5 segundos é frustrante. Em SAC, vendas, atendimento clínico, a diferença entre LPU e GPU define se o agente vira sucesso ou abandono.

2. Custo de inferência muda o P&L

Em 2026, custo de inferência (rodar modelo respondendo a milhares de prompts/dia) já é parte relevante do P&L de empresas AI First. Decisão de stack (Groq vs GPU NVIDIA vs TPU Google vs Anthropic Claude) muda margem.

3. Vendor lock-in vira problema estratégico

Empresa que constrói tudo em torno de um único fornecedor (NVIDIA + AWS + OpenAI, por exemplo) vira refém. Quem domina conceitualmente os trade-offs negocia melhor e mantém optionality.

4. Anúncios de mercado são pistas estratégicas

Cada anúncio grande (NVIDIA-Groq, Meta-Manus US$ 2bi, NemoClaw lançamento) revela onde o mercado está investindo capital sério. Conselheiro que ignora essas pistas decide no escuro.

O mínimo que C-level precisa saber conceitualmente

Você não precisa saber projetar chip nem programar CUDA. Mas precisa, em reunião de board, conseguir conversar sobre:

GPU (Graphics Processing Unit) — NVIDIA

Originalmente para gráficos, virou dominante em treinamento de modelos de IA
Cara, escassa, ciclo de produção longo
Ainda imbatível em treinamento de modelos grandes

TPU (Tensor Processing Unit) — Google

Chip customizado do Google, otimizado para operações tensoriais
Usado em treinamento e inferência dentro da infraestrutura Google
Disponível para clientes via Google Cloud

LPU (Language Processing Unit) — Groq (agora parte NVIDIA)

Chip especializado em inferência de linguagem
Latência ultra-baixa (10x mais rápido em demos)
Foco em UX de agente em produção

Trade-offs práticos

Métrica	Treinamento (GPU)	Inferência rápida (LPU)	Inferência custo-otimizada
Velocidade	irrelevante	crítica	secundária
Custo unitário	altíssimo	médio	baixo
Quando usar	criar/treinar modelo próprio	agente em SAC, atendimento	batch processing, relatórios

Saber conversar nesse nível é o mínimo aceitável para C-level em 2026. Não saber é Analfabetismo Estrutural.

A pergunta que separa C-level letrado de C-level desatualizado

Em reunião com seu CTO ou diretor de TI, faça a pergunta:

"Nossa stack de IA tem dependência de qual fornecedor? Em treinamento, qual GPU? Em inferência, é cloud ou edge? Qual o custo médio de inferência por mil tokens? Se NVIDIA muda preço amanhã, qual o impacto no nosso P&L?"

Se você não consegue formular essa pergunta, você delega decisão estratégica de IA para alguém que não conhece o seu P&L.
Se você formula mas seu CTO não tem resposta clara, seu CTO precisa de plano de aprendizado urgente.
Se ambos sabem responder, você está construindo vantagem competitiva real.

Como sair do Analfabetismo Estrutural em 90 dias

Plano mínimo:

4h/semana de estudo deliberado em IA (release notes oficiais, papers técnicos, vídeos de keynote)
1 hands-on por semana (criar agente, testar ferramenta nova, brincar com prompt)
1 conversa por semana com practitioner real (não consultor que dá palestra — pessoa que faz)
Aplicar o autoteste de 10 perguntas em 60 e 90 dias para medir evolução

Em 90 dias, você muda de patamar. Não é exagero — é matemática de prática deliberada.

Conclusão

O deal NVIDIA-Groq não é "notícia do Vale do Silício". É sinal de mercado que muda como sua empresa deve pensar stack de IA nos próximos 5 anos.

Conselheiro e CEO que ignoram esses sinais ficam em Analfabetismo Estrutural — condição que custa caro nos próximos 24 meses.

A Fhinck forma e provoca C-levels brasileiros sobre exatamente esses temas. Se quiser conversar sobre como sair do Analfabetismo Estrutural no seu board, agende uma conversa.

NVIDIA fecha US$ 20bi com Groq — e seu C-level deveria saber o que...