Nos últimos dois anos as grandes empresas de tecnologia começaram a apresentar o conceito de AI PCs (no Brasil, IA PCs) para o público. São computadores mais focados em inteligência artificial em meio à febre das IAs generativas, e todo o seu desempenho é medido em TOPS. Mas, o que exatamente são esses TOPS?

Sigla muito utilizada na computação há muito tempo, o conceito de TOPS é algo extremamente novo para o consumidor comum. Para entender melhor essa sigla, o TecMundo conversou com o engenheiro de aplicações da Intel, Yuri Daglian, e vamos te ajudar a entender melhor o mundo da IA.

NPU e IA

Antes de tudo, vamos começar pelo início. Antes de falarmos em TOPS, é preciso entender como a IA nos novos AI PCs funcionam. Esses notebooks e computadores só são chamados assim porque neles houve a introdução de uma parte no processador chamada de NPU (Unidade de Processamento Neural).

O processador, ou CPU, é aquele cérebro dos computadores, responsável por realizar o cálculo lógico, interpretar, processar dados e fazer com que eles sejam exibidos em algo entendível por nós. Essa CPU é dividida em várias partes, cada uma com uma função, e a NPU é uma nova partezinha adicionada em processadores da Intel, Qualcomm, AMD, etc.

A grande ideia por trás dessa NPU era que os usuários pudessem executar cargas de trabalho de IA generativa direto do computador, ou seja, nativamente. Isso acaba com a necessidade de tudo ser processo nos servidores da Microsoft para quem usa o Copilot, ou nos do Google para quem gosta do Gemini, ou nos da OpenAI para os fãs do ChatGPT.

Ilustração de uma NPU
A NPU é apenas um bloco específico dentro dos chips, mas no passasdo era uma peça separada (Imagem: Intel)

“Toda a arquitetura da NPU foi projetada, desde o início, para redes neurais. Ela foi feita para oferecer ótima performance, consumindo pouca energia. Uma grande máxima na computação é que aceleradores específicos [NPUs], projetos para fins específicos [IAs], sempre vão ter mais desempenho e eficiência energética do que unidades de processamento gerais [CPUs]”, explica Yuri Daglian.

A Unidade de Processamento Neural é uma partezinha no chip especializada em executar cargas de trabalho voltadas para inteligência artificial, com mais desempenho e gastando menos energia. Por isso os notebooks mais novos são chamados de AI PCs e muitas vezes certificados como Copilot+PCs, pois eles têm CPUs com essa unidade.

Contudo, o desempenho dessas NPUs e dos novos IAs PCs são medidos em TOPS. Mas, o que são esses TOPS mesmo?

O que são TOPS de IA?

TOPS é o acrônimo para Trilhões de Operações Por Segundo, uma unidade de medida para se referir ao desempenho na inferência de inteligência artificial. Como aponta o especialista da Intel, essa sigla aponta que os TOPS conseguem realizar uma quantidade absurda de operações em determinado período.

De maneira simples, tanto o funcionamento dos computadores quanto o de inteligências artificiais, são matemática pura. Dessa forma, quanto mais cálculos o chip realizar em menos tempo, mais desempenho ele entregará para o usuário. Assim, teoricamente, quanto mais TOPS uma Unidade de Processamento tem, mais desempenho a máquina terá em IA.

O que são TOPS de IA?
É interessante entender esses TOPS como uma unidade de medida (Imagem: Qualcomm)

Como funcionam os TOPS?

Os TOPS basicamente realizam essas operações matemáticas em uma rede neural. A rede neural é um método que utiliza aprendizado de máquina para ensinar o computador a realizar determinadas tarefas de modo similar, mas não igual, ao cérebro humano.

A rede neural mais básica utilizada se chama Perceptron — e não, não vem dos Transformers. O Perceptron é a rede neural mais básica existente, mas nos ajuda a compreender o funcionamento das IAs. Observe a imagem abaixo:

Funcionamento do Perceptron
Ilustração do Perceptron, a base das redes neurais (Imagem: DataScientist/Reprodução)

Na ilustração, XYZ são números constantes e a letra W é um determinado peso atribuído a eles. A combinação entre os números e os pesos geram uma saída, que basicamente é a resposta para uma pergunta.

Quando perguntamos a um ChatGPT da vida quanto é 1+1, esses números constantes serão somados ou multiplicados com os pesos. Cada número testará diversas combinações de pesos diferentes, como 0+0, 0,5+0, 0 + 1, etc. Eventualmente, um número constante encontrará que 0 + 1 é igual a 1, e outro número fará 0 + 1 é igual 1, somando 1 + 1 e achando a resposta igual a 2.

Dessa forma é que as redes neurais são treinadas, com uma combinação gigantesca de números e pesos que vão repetir esses processos até chegar no resultado esperado, como explica Yuri Daglian. “As operações que uma NPU vai realizar são operações de multiplicação, adição. Em casos muito complexos, ela vai fazer adição e multiplicação de matrizes”, aponta o engenheiro de aplicações.

O que são TOPS de IA?
Novos processadores da Intel uma arquitetura bem modularidade, cheia de blocos com diferentes funções (Imagem: Intel)

Daglian brinca que “os computadores gostam de calcular matrizes”, já que são contas bem mais simples para as máquinas. Os PCs calculam essas matrizes em uma escala “descomunal” de bilhões de parâmetros para chegar em uma resposta final. Essas são as operações contidas nos TOPS.

Quando dizemos que uma rede neural está sendo treinada, significa que os desenvolvedores estão rodando bilhões de pesos diferentes, em um sistema de tentativa e erro, até que as respostas sejam exatas, ou do melhor tipo possível.

“Inteligência artificial é matemática pura. Ela não é mística. Não tem uma mágica acontecendo. Tem matemática pura”, aponta Daglian.

Quantos TOPS eu preciso?

Teoricamente, quanto mais TOPS a NPU têm, maior será a sua capacidade em lidar com determinadas cargas de IA. No entanto, não há uma resposta exata para uma quantidade ideal de TOPS e isso depende muito da atividade realizada.

Notebook com selo Copilot+PC
A Microsoft classifica que os computadores Copilot+PC precisam ter mais de 40 TOPS na NPU (Imagem: Microsoft)

Como indica o engenheiro de aplicações da Intel, pode ser que 5 TOPS já sejam suficientes para o Microsoft Teams conseguir criar sem travamentos aqueles fundos virtuais nas reuniões, ou que utilize um filtro inteligente para remover o ruído do microfone.

Se o usuário quer rodar um aplicativo com base em uma SLM (Pequeno Modelo de Linguagem), algo entre 15 e 20 TOPS já deve ser suficiente. Agora, rodar uma LLM (Grande Modelo de Linguagem), que é muito mais pesada e complexa, pode exigir mais de 100 TOPS, dependendo de sua otimização.

“Eu diria que para ter uma experiência interessante hoje em dia, pelo menos 10 TOPS de NPU para conseguir executar aplicações de forma legal. Agora, se penso para o futuro, aí tenho que mirar em pelo menos 40 TOPS”, sugere Yuri Daglian.

TOPS de CPU e GPU

Sim, os TOPS são amplamente utilizados quando falamos em Unidades de Processamento Neural, mas também há TOPS nos processadores tradicionais e nas placas de vídeo dedicadas ou integradas. Os processadores Intel Core Ultra Série 2, por exemplo, exemplificam isso bem.

Essa geração da Intel para notebooks tem uma implementação máxima de 120 TOPS. Desses 120, somente 48 TOPS estão na NPU, enquanto 5 ficam no processador e 67 estão na placa de vídeo integrada. CPUs e GPUs sempre tiveram esses TOPS, afinal de contas usamos IA em filtros do Google Meet e em outros recursos há anos.

Placa de vídeo Intel Arc B580
Para processos muito complexos envolvendo IA, os desenvolvedores usam placas gráficas ou aceleradores extremamente potentes (Imagem: Intel)

Geralmente, as placas de vídeo são as peças de hardware com mais TOPS, principalmente os modelos dedicados. Uma RTX 5090 da Nvidia, por exemplo, tem incríveis 3.300 TOPS de IA, enquanto uma Intel Arc B580 recém-lançada possui 233 TOPS — que já é uma quantidade bem considerável.

Contudo, como Yuri Daglian explica, as placas de vídeo não são fielmente projetadas para executar cargas de trabalho como uma NPU. “A GPU tem uma otimização para cálculos paralelos, então ela tem muitos núcleos que conseguem trabalhar ao mesmo tempo, para fazer uma conta. A CPU é mais sequencial, então faz uma conta primeiro, termina, faz outra, etc”, aponta o especialista.

Apesar das placas de vídeo e processadores também realizarem esse trabalho, Yuri finaliza ao explicar que a NPU é sempre mais eficiente, já que consome menos energia ao realizar essas tarefas.

Gostou de aprender sobre os TOPS e o funcionamento das IAs? Então continue ligado no site do TecMundo. E se você curte hardware e informática, não esqueça de conferir o nosso review da GeForce RTX 5080 Founders Edition. 

#SuperCurioso | www.supercurioso.online

Previous post Bloodborne roda em primeira pessoa no PC! Veja o resultado
Next post Guerra Civil, filme da A24 com Wagner Moura, estreia na Netflix nesta sexta (18)