Por que a Baidu está começando pelo "sistema operativo" para criar uma IA que é "onipotente e omnipresente"?

Autor: bombear geek

O grande modelo consegue resumir o que aconteceu na China ao longo de cinco mil anos, mas não consegue responder que horas são agora; consegue explicar claramente o que é a mecânica quântica, mas é difícil fazer uma apresentação em PPT profissional com texto e imagens.

Por que os grandes modelos parecem ter todas as respostas, mas na prática estão sempre um pouco aquém?

A razão é simples: ser inteligente e erudito não significa ser capaz de trabalhar.

Inteligente, precisa de grandes modelos treinados e aprendidos através de um vasto conhecimento, desenvolvendo um cérebro avançado que pode responder bem a uma pergunta;

E ao mesmo tempo que se satisfazem os dois elementos de ser inteligente e competente, é necessário dar a este cérebro inteligente membros ágeis, para alcançar "pensamento profundo + entrega profunda".

É também por isso que a forma como impulsionar o grande modelo de um pensamento inteligente para uma evolução que seja "inteligente e capaz" tornou-se o fator decisivo para saber se esta onda de grandes modelos é apenas um fenômeno passageiro ou se mudará a história.

O Baidu forneceu uma amostra.

No dia 25 de abril, na conferência de desenvolvedores de IA Create 2025 da Baidu, o fundador da Baidu, Li Yanhong, apresentou o primeiro sistema operacional do mundo no campo do conteúdo - Cangzhou OS, lançado em conjunto pela Baidu Wenku e Baidu Wangpan.

Através da plena integração das tecnologias, capacidades e dados subjacentes acumulados pelo Baidu Wenku e pelo Baidu Pan, pode fluir como a água, integrando-se em diferentes cenários, alcançando a entrega de alta qualidade com baixo limiar e uma interface de interação mais conveniente para o utilizador.

Baseando-se no Cangzhou OS, a visão e expectativa da Baidu Wenku e Baidu Wangpan para a IA é, a qualquer momento, em qualquer lugar, em qualquer dispositivo terminal, alcançar uma verdadeira entrega de ponta a ponta, permitindo que a IA seja "onipotente e onipresente".

01

Cangzhou OS, permitindo que a IA avance para uma evolução a nível de sistema operativo.

No setor de tecnologia, há um consenso de que qualquer tecnologia que passe do laboratório para realmente chegar a milhares de lares precisa passar por um longo processo de curva de Gartner.

Nesta curva, o crescimento da primeira fase depende principalmente das expectativas de euforia de mercado trazidas pelos avanços tecnológicos, mas à medida que os resultados da implementação da tecnologia não são ideais, o crescimento desta fase irá rapidamente entrar em declínio, até que as condições necessárias para a implementação da tecnologia amadureçam gradualmente e sejam concretizadas como uma infraestrutura quase sem barreiras, onipotente e omnipresente, e a explosão ecológica da segunda fase se seguirá.

Um dos sinais do início da segunda fase da indústria de software é geralmente o surgimento de um sistema operativo maduro, como o Windows para a indústria dos computadores, ou o iOS para a indústria dos telemóveis.

Como definir um sistema operativo maduro? Há cerca de 15 anos, a indústria tecnológica global teve um debate sobre isso: tendo em conta que ambos podiam ser operados por toque, eram smartphones de grandes ecrãs, podiam fazer chamadas, tirar fotos, ouvir música e enviar mensagens, por que razão a Apple ou os smartphones eram duas espécies diferentes em relação aos antigos telemóveis funcionais.

Uma das principais razões é que o iOS herdou a estabilidade e a capacidade de multitarefa a nível de núcleo do MAC OS, e transformou isso em um ecossistema aberto, onde os desenvolvedores podem integrar à vontade essas capacidades de base da Apple, criando suas próprias aplicações inovadoras. Isso também fez com que a definição de um telefone, que antes era uma questão de algumas gigantes como Motorola e Nokia, se tornasse um grande setor com a participação de todo o ecossistema, com possibilidades infinitas, abrindo assim as portas para mais de uma década de internet móvel.

A tecnologia avança constantemente, mas as narrativas comerciais tendem a repetir-se com um ritmo semelhante. A lógica subjacente, que foi validada em sistemas operativos móveis, continua a ser aplicável na construção de sistemas operativos na era dos grandes modelos.

Resumindo, há três: capacidade de base completa, agendamento central flexível e um ecossistema de serviços de aplicação próspero. Isso corresponde exatamente à arquitetura em três camadas do Cangzhou OS: infraestrutura de base, sistema central e serviços de aplicação. A única diferença é que a ponte entre a aplicação e o central, e a base, foi trocada de API para MCP, que é mais padronizado e de menor barreira de entrada.

Entre eles, a infraestrutura base da parte do MCP Server, o seu componente central é o Chatfile plus, cuja principal função é, através de uma estrutura de conhecimento, realizar a decomposição e análise em nível de elemento de conteúdos de diferentes modalidades, formas e formatos, bem como uma série de componentes de ferramentas para compreensão multimodal, recuperação multimodal, transcodificação e análise de arquivos.

Ao mesmo tempo, o Baidu Wenku e o Wangpan construíram três grandes bibliotecas: a biblioteca de conhecimento público, a biblioteca de conhecimento privado e o repositório de memória. Isso refere-se especificamente aos dados de conhecimento público acumulados pelo Baidu Wenku ao longo dos anos (biblioteca de conhecimento público), aos dados de conhecimento utilizados com autorização dos usuários no Wangpan (biblioteca de conhecimento privado) e aos comandos, hábitos de uso e registros gerados historicamente pelos usuários em Wenku ou Wangpan (repositório de memória).

Estes dados são frequentemente apresentados em diferentes modalidades, formas e formatos. Entre eles, o repositório de conhecimento público fornece conhecimento genérico, enquanto o repositório de conhecimento privado e a memória armazenam dados personalizados dos usuários.

No quadro de conhecimento, o Cangzhou OS irá processar o conteúdo multimodal nos "três grandes repositórios" através da vetorização e rotulagem, ou seja, transformar dados não estruturados como imagens, texto, vídeo, áudio e documentos em dados vetoriais multidimensionais que o computador pode entender, ou seja, um conjunto de tokens.

E no sistema central, o Baidu Wenku e o Wangpan desenvolveram internamente os "três grandes dispositivos", que são o editor integrado (para edição de documentos, PPT, etc.), o leitor (para leitura de documentos e conteúdos de PPT, etc.) e o reprodutor (para reprodução de áudio e vídeo), entre outras ferramentas.

Ao mesmo tempo, o Cangzhou OS também pode, através do "Centro de Agendamento", combinar componentes de interação, modelos de intenção e infraestrutura de transporte, juntamente com dados de memória e perfil do usuário, para entender a intenção do usuário através de modelos e alocar eficientemente os Agentes de Agendamento.

No nível mais alto, existe uma série de Agentes de IA. O "Cangzhou OS" integra uma biblioteca, disco em nuvem de PPT, livros ilustrados de IA, mapas mentais de IA, cartazes de IA, anotações de IA, digitalização de IA, transcrição de IA e centenas de outros Agentes de IA. Os modos gerados abrangem vários tipos, como imagem, texto, vídeo e áudio, cobrindo completamente cenários de aprendizado e trabalho, bem como entretenimento e vida diária. Além disso, baseia-se nas capacidades de edição, modificação e ajuste fino do editor integrado, permitindo que a qualidade da pesquisa e da geração de conteúdo seja mais alta e mais alinhada com as necessidades personalizadas das tarefas reais.

02

No Cangzhou OS,

Criar mais Agentes "inteligentes e competentes"

Em torno dos serviços de aplicação de topo, o Baidu Wenku & Baidu Wangpan lançaram centenas de agentes de IA testados por centenas de milhões de usuários, ao mesmo tempo que integraram uma grande quantidade de agentes profissionais de terceiros para ampliar o ecossistema de aplicações.

Como uma "plataforma de obtenção e criação de conteúdo AI de uma só parada", o número de usuários pagos do Baidu Wenku já ultrapassou 40 milhões, enquanto os usuários ativos mensais de AI atingiram 97 milhões. O Baidu Wangpan também foi atualizado para "plataforma de serviços de conteúdo de uma só parada", atendendo mais de 1 bilhão de usuários, com um espaço de armazenamento total superior a 100 bilhões de GB, e os usuários ativos mensais de AI ultrapassam 80 milhões. Baidu Wenku e Baidu Wangpan tornaram-se verdadeiramente a "super produtividade" na era dos grandes modelos.

Na conferência, a Baidu Wenku e o Baidu Wangpan também apresentaram novas capacidades desenvolvidas com base no "Cangzhou OS": "GenFlow Super Buddy" e "AI Notas".

GenFlow Super Partner é a capacidade de colaboração de múltiplos agentes lançada pelo aplicativo Baidu Wenku, com o suporte do "Cangzhou OS", a geração de conteúdo pode realizar múltiplas tarefas em paralelo e também pode completar várias tarefas com base nas informações mais abrangentes e profissionais disponíveis na rede, assim como os hábitos e preferências dos próprios usuários.

Por exemplo, o usuário deseja fazer uma planeamento de casamento, mas a entrada inicial é apenas uma frase simples: Eu quero realizar um casamento ao ar livre em Hainan no Dia do Trabalho, ajude-me a fazer o plano e o convite.

A demanda parece simples, basta preencher as lacunas com base em um modelo histórico. Mas para garantir a satisfação do usuário, é necessário conhecer suas preferências estéticas, expectativas de orçamento e preferências de processo. Também é preciso saber sobre o clima em Hainan durante o feriado de 1º de maio, o fluxo de pessoas e a distribuição dos locais. Após isso, é necessário combinar essas imagens e informações com um software de PPT para gerar um plano completo. Por fim, com base no plano e nas preferências estéticas do usuário, gerar um cartaz completo para o convite de casamento.

Para concluir o acima mencionado, é necessário agendar separadamente o histórico de conversas dos usuários, histórico de navegação, bem como reconhecimento de intenção, pesquisa na web e ferramentas de PPT, analisar a intenção dos usuários, entender as preferências dos usuários, combinar livremente as ferramentas e, por fim, apresentar ao usuário um plano completo muito específico que inclua o processo, datas, locais, orçamento, tema, detalhes de execução, estilo e arranjos de pessoal.

Ao mesmo tempo, o plano que o usuário precisa e o cartaz devem combinar entre si, o que requer que todas as informações de ambos permaneçam consistentes e sejam geradas em paralelo usando o mesmo sistema operacional.

Claro, a IA definitivamente não consegue gerar resultados que satisfaçam a todos de uma só vez, o que requer que tanto os planos de casamento quanto os cartazes tenham capacidade de edição. E o que suporta essa capacidade é a funcionalidade de editor integrado do "Cangzhou OS".

Não é difícil perceber que, desde o pensamento profundo até a entrega profunda, o GenFlow Super Partner é praticamente o único produto verdadeiramente "colaborativo com múltiplos agentes" disponível no mercado. Ele não apenas resolve os problemas comuns de produtos colaborativos com múltiplos agentes, como altos custos, longos tempos de geração, baixa eficiência, incapacidade de entrega estável e a impossibilidade de ajuste em múltiplos diálogos, mas também é diretamente incorporado à combinação de produtos maduros e dados privados autorizados pelos usuários, permitindo que a IA realmente tenha a oportunidade de alcançar o objetivo de "tudo-poderoso e onipresente".

As notas de IA do Baidu Wangpan são uma grande ajuda para muitos trabalhadores de escritório e para aqueles que se preparam para exames.

As Notas de IA são as primeiras Notas de IA multimodais da indústria, que podem integrar vários vídeos de estudo e páginas de notas armazenados pelos usuários no Baidu Wangpan na mesma interface, alcançando uma interação suave, e o conteúdo dos vídeos e das notas estão fortemente interligados. Desde assistir ao vídeo, gerar Notas de IA, resumir o Mapa Mental de IA até, finalmente, gerar questões de IA para verificar os resultados de aprendizagem, cobrindo completamente todo o ciclo de aprendizagem dos usuários.

Por exemplo, o exame de inglês para pós-graduação tornou-se um tópico popular recentemente, com os usuários querendo fazer uma revisão concentrada sobre o inglês do exame. As anotações de IA primeiro farão uma busca nos materiais relevantes armazenados na nuvem do usuário, ao mesmo tempo em que consultarão os pontos de exame fornecidos por materiais publicados na internet, organizando-os. Mas todo o processo não termina aí; as anotações de IA também combinarão questões de anos anteriores para fazer a verificação final dos pontos de exame gerados, e apenas os pontos verificados poderão ser usados como base para continuar a gerar mapas mentais e previsões de questões, ajudando os usuários a acelerar seu progresso de aprendizagem.

E durante esse processo, as ferramentas envolvidas não são menos do que as usadas para planejar um casamento. Por exemplo, encontrar locais de exame e questões reais requer habilidades de pesquisa na web, enquanto as questões reais geralmente são apresentadas em formato PDF ou até mesmo em imagens, e a interpretação de grandes mestres é apresentada em formato de vídeo, o que exige a capacidade de analisar conteúdos multimodais. A geração do mapa mental final e a previsão das questões do exame exigem a capacidade de raciocínio de grandes modelos, a capacidade de geração de conteúdos multimodais, bem como a capacidade de mapear e relacionar diferentes conteúdos, ao mesmo tempo em que garantem a absoluta precisão da geração de conteúdo.

Isto por trás é o empoderamento do "Cangzhou OS".

Claro, o Baidu apoia os desenvolvedores a abraçar plenamente o MCP, portanto, o sistema operacional Cangzhou OS não serve apenas ao ecossistema interno do Baidu. Um dos aspectos mais importantes do crescimento e desenvolvimento do sistema operacional é a abertura ao exterior, estimulando a capacidade de inovação dos desenvolvedores.

Assim, para maximizar o valor do ecossistema e das aplicações, o Baidu Wenku e o Baidu Wangpan, com base no "Cangzhou OS", foram os primeiros a aplicar plenamente o MCP na ligação entre produtos e ecossistemas, construindo um sistema de três camadas MCP Server-Client-Host, abrindo as capacidades da biblioteca e do armazenamento na forma de MCP Server e facilitando a integração de mais usuários empresariais, desenvolvedores e aplicações de agentes inteligentes através do MCP Client SDK.

Entre eles, o caso mais representativo é o dos smartphones Samsung. Os smartphones Samsung estão a conectar-se a múltiplos servidores MCP para upload, download, pesquisa, partilha e compreensão de conteúdo do Baidu Wenku.

Por um lado, os utilizadores podem, na interface do assistente de voz do telefone, realizar diretamente funcionalidades como o upload de ficheiros para o backup na nuvem, partilha na nuvem, resumo de documentos e respostas a perguntas de conteúdo, apenas falando.

Por outro lado, estes servidores também conseguem enriquecer a capacidade de armazenamento em nuvem do sistema dos telemóveis Samsung, resolvendo o problema da dificuldade de fazer backup e partilhar em massa arquivos grandes e múltiplos.

Por exemplo, se o usuário disser ao assistente de voz no álbum de fotos do celular: "Faça backup das fotos tiradas ontem no Aosen para o Baidu Wangpan e envie as fotos do Xiao Ming para ele". As fotos relevantes serão carregadas na conta do Wangpan autorizada pelo usuário e um link de compartilhamento será gerado. O assistente do celular então acessa a lista de contactos e envia este link via SMS para o telefone da outra pessoa; basta clicar no link para que o usuário possa acessar diretamente o Baidu Wangpan para visualizar ou transferir.

Sem dúvida, verificar se as capacidades subjacentes do OS são confiáveis não depende da acumulação de ferramentas ou da quantidade de tecnologia avançada. A qualidade, maturidade e riqueza do ecossistema de serviços de aplicação de topo são o melhor padrão para avaliar as capacidades do OS.

03

A história do OS não tem fim.

No mercado de capitais, o tipo de empresa que mais é reconhecido pelos investidores é chamado de "amigo do tempo".

O chamado amigo do tempo é que, quando uma empresa faz algo certo, tudo o que precisa fazer em seguida é continuar, e assim o desempenho manterá um crescimento em modo de máquina perpétua, e os desenvolvedores de ecossistemas também poderão continuar a beneficiar.

E o sistema operativo é assim um típico mercado de movimento perpétuo. Enquanto o mercado de computadores e smartphones existir, a história dos sistemas operativos pertencentes à Microsoft, Apple, Google e outros não terá fim.

Os grandes modelos seguem a mesma lógica. Quando a combinação de "pensamento profundo + entrega profunda + dados públicos e privados + ecossistema MCP" se reunir, e o futuro se tornar uma IA onipresente e onipotente da nova era, então, uma explosão de novas espécies semelhante à explosão cambriana começará a surgir continuamente.

Neste processo, olhar para baixo é a abertura das suas capacidades por parte de Baidu Wenku, Baidu Wangpan e outros. Ao abraçar ativamente o ecossistema, tornar-se criador de novas espécies de grandes modelos e formulador de novas regras.

Olhando para cima, são incontáveis novos Agentes criados e visíveis com base no "Cangzhou OS", formando um poderoso ecossistema de novos serviços de aplicação.

E agora, todas as histórias estão apenas a começar.

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • 1
  • Partilhar
Comentar
0/400
GateUser-b76d427bvip
· 04-28 17:47
obrigado pelo artigo interessante
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)