Na economia digital dos dias atuais, os dados oferecem enormes oportunidades na busca de valor para os negócios. Entretanto, extrair insights em tempo real de transações corporativas pode ser mais desafiador do que pensamos. É difícil executar modelos de deep learning em altos volumes de dados transacionais com soluções de inferência baseadas fora da plataforma, pois a latência, a variabilidade e as preocupações de segurança podem torná-las impraticáveis em aplicações sensíveis ao tempo de resposta. A IBM está enfrentando esse desafio, desenvolvendo inovações no design de sistemas e microprocessadores.
O processador IBM Telum
Em meados de 2021 a IBM anunciou o lançamento do Telum, que será o chip central de processamento para os sistemas IBM Z e LinuxONE de próxima geração. As organizações que procuram melhorar a prevenção de fraudes em tempo real ou em outros casos específicos de uso se beneficiarão dessas inovações do IBM Z, projetadas para fornecer inferência em tempo real nas transações de grande escala.
O microprocessador de 7 nm foi projetado para atender às demandas que as organizações enfrentam para obter insights baseados em IA de seus dados, sem comprometer o tempo de resposta para cargas de trabalho transacionais de alto volume. Para ajudar a atender a essas necessidades, o IBM Telum foi projetado com um novo acelerador no chip dedicado para inferência de IA, que possibilita IA em tempo real incorporada diretamente em cargas de trabalho transacionais, juntamente com melhorias de desempenho, segurança e disponibilidade.
Características funcionais
O microprocessador contém 8 núcleos de processador com clock de mais de 5 GHz, com cada núcleo suportado por um cache privado de nível 2 de 32 MB redesenhado. Os caches de nível 2 interagem para formar um cache virtual de 256 MB de nível 3 e 2 GB de nível 4. Juntamente com as melhorias no próprio núcleo do processador, o aumento de uma vez e meia de cache por núcleo em relação à geração z15 foi projetado para permitir uma melhoria significativa tanto no desempenho dos threads quanto na capacidade total que a IBM pode fornecer na próxima geração dos sistemas IBM Z. As melhorias de desempenho do Telum são vitais para se obter tempos de resposta mais rápidos em sistemas complexos de transações, especialmente aqueles que demandam inferência de IA em tempo real.
O Telum também apresenta inovações significativas em segurança, com criptografia transparente da memória principal. As melhorias do Telum Secure Execution são projetadas para fornecer maior desempenho e usabilidade para servidores virtuais hiperprotegidos e ambientes confiáveis de execução, tornando o Telum a escolha ideal para processar dados confidenciais em arquiteturas de nuvem híbrida.
O chip predecessor IBM z15 foi projetado para viabilizar uma disponibilidade de sete noves, líder do setor para sistemas IBM Z e LinuxONE. O Telum foi projetado para melhorar ainda mais a disponibilidade com inovações importantes, que incluem uma interface de memória de 8 canais redesenhada, capaz de tolerar falhas completas de canal ou DIMM e projetada para recuperar dados de forma transparente, sem impacto no tempo de resposta.
Os processadores IBM Z têm um histórico de incorporar aceleradores específicos, projetados para melhorar o desempenho de tarefas comuns, como criptografia, compactação e classificação. O Telum adiciona um novo acelerador de IA integrado, com capacidade de computação de mais de 6 TFLOPs por chip. Cada núcleo tem acesso a esse acelerador e pode aproveitar dinamicamente toda a capacidade de computação, para minimizar a latência de inferência. Devido à arquitetura do acelerador centralizado com conexão direta à infraestrutura de cache, o Telum apresenta inferência de latência extremamente baixa para cargas de trabalho sensíveis ao tempo de resposta. Com suporte planejado para sistemas com até 200 TFLOPs, a aceleração de IA também foi projetada para atender aos requisitos das cargas de trabalho mais exigentes.
Vantagens de latência e segurança
Manter dados no IBM Z oferece muitas vantagens de latência e proteção de dados. A baixa latência e consistência do IBM Telum auxilia as empresas a maximizar esses benefícios, permitindo incorporar IA em transações sensíveis ao tempo de resposta. Com isso, as organizações podem aproveitar os benefícios da inferência de IA para controlar melhor o resultado das transações antes de concluí-las. Por exemplo, alavancar a IA para mitigação de riscos em aplicativos de compensação e liquidação financeira, para prever quais negócios ou transações têm exposições de alto risco e propor soluções para um processo de liquidação mais eficiente. Uma correção mais rápida de transações questionáveis pode ajudar as empresas a evitar consequências caras e impactos negativos aos negócios.
Por exemplo, um banco internacional usa IA no IBM Z como parte de seu processo de autorização de cartão de crédito, em vez de usar uma solução de inferência fora da plataforma. Como resultado, a instituição financeira pode detectar fraudes durante o processamento da autorização de transações de cartão de crédito. Para o futuro, essa instituição deseja atingir tempos de resposta abaixo de milissegundos, explorando modelos complexos de IA e Deep Learning e mantendo a escala crítica e a taxa de transferência necessárias para avaliar até 100.000 transações por segundo, representando um aumento de quase 10 vezes em relação ao que eles podem alcançar atualmente. O banco deseja obter tempos de resposta de inferência consistentes e confiáveis, com baixa latência de milissegundos para examinar todas as transações em busca de fraudes. O Telum foi projetado para ajudar a atender a esse tipo de requisitos desafiadores, especificamente para executar cargas de trabalho transacionais e de IA combinadas em grande escala.
Atualmente, para alavancar os negócios e manter a competitividade não importa apenas ter dados disponíveis, mas como podemos aproveitá-los para obter o máximo de insights. Por isso, saber utilizar a IA e ter a infraestrutura adequada para suportá-la tornaram-se novos padrões na jornada de transformação digital.