Modelo de linguagem AI sem restrições: novas ameaças de segurança no campo dos ativos de criptografia

2025-07-12 16:51:27

O lado sombrio da inteligência artificial: a ameaça dos modelos de linguagem sem restrições

Com o rápido desenvolvimento da tecnologia de inteligência artificial, modelos de linguagem avançados estão a mudar profundamente a nossa forma de trabalhar e viver. No entanto, este avanço tecnológico também trouxe perigos potenciais - a emergência de modelos de linguagem grandes, irrestritos ou maliciosos.

Modelos de linguagem sem restrições referem-se àqueles que foram especificamente projetados, modificados ou "desbloqueados" para contornar os mecanismos de segurança e as limitações éticas incorporadas nos modelos mainstream. Embora os desenvolvedores de modelos de linguagem mainstream geralmente invistam muitos recursos para evitar que os modelos sejam usados para gerar discursos de ódio, informações falsas, códigos maliciosos ou fornecer instruções para atividades ilegais, algumas pessoas ou organizações, por diferentes motivos, começaram a procurar ou desenvolver por conta própria modelos sem restrições.

A aparição deste modelo sem restrições tornou possível a realização de tarefas que antes requeriam conhecimentos técnicos especializados, como escrever código malicioso, criar e-mails de phishing e planejar fraudes, agora podendo ser facilmente realizadas até por pessoas comuns sem experiência em programação. Os atacantes apenas precisam obter os pesos e o código-fonte do modelo de código aberto e, em seguida, realizar um ajuste fino em um conjunto de dados que contenha conteúdo malicioso, discursos de ódio ou instruções ilegais, podendo assim criar ferramentas de ataque personalizadas.

Esta tendência traz vários riscos:

Os atacantes podem personalizar modelos com base em alvos específicos, gerando conteúdos mais enganosos que contornam a revisão de conteúdo e as restrições de segurança dos modelos de linguagem convencionais.
O modelo pode ser usado para gerar rapidamente variantes de código de sites de phishing ou para personalizar textos de fraude para diferentes plataformas sociais.
A acessibilidade e a modificabilidade dos modelos de código aberto fomentam a formação e a propagação do ecossistema de IA subterrânea, criando um ambiente propício para transações e desenvolvimentos ilegais.

Aqui estão alguns modelos de linguagem ilimitados típicos e suas potenciais ameaças:

Um modelo de linguagem malicioso: Este é um modelo malicioso vendido publicamente em fóruns underground, e o desenvolvedor afirma que não tem nenhuma limitação ética. Ele é baseado em um modelo de código aberto e foi treinado em uma grande quantidade de dados relacionados a malware. Este modelo pode ser usado para gerar e-mails de invasão comercial realistas e e-mails de phishing, podendo ser utilizado no campo das criptomoedas para gerar informações de phishing, escrever código malicioso e impulsionar fraudes automatizadas.
Modelo especializado: Este é um modelo pré-treinado em dados da dark web, cujo objetivo original é ajudar investigadores e autoridades de aplicação da lei a entender a ecologia da dark web. No entanto, se for obtido por agentes maliciosos ou se tecnologias semelhantes forem usadas para treinar modelos sem restrições, pode ser utilizado para realizar fraudes precisas ou imitar métodos criminosos.
Um modelo de fraude: Este é um modelo malicioso mais abrangente, vendido principalmente na dark web e em fóruns de hackers. No campo das criptomoedas, pode ser utilizado para falsificar projetos, gerar em massa páginas de phishing, realizar atividades de manipulação em redes sociais e ataques de engenharia social.
Um modelo sem restrições morais: Este é um chatbot de IA claramente posicionado como sem restrições morais. No campo das criptomoedas, pode ser utilizado para ataques de phishing avançados, gerar código malicioso para contratos inteligentes, criar ladrões de criptomoedas polimórficos, realizar ataques de engenharia social e fraudes de deepfake.
Uma plataforma aberta: esta plataforma oferece acesso a vários modelos de linguagem, incluindo alguns modelos com menos censura ou restrições mais suaves. Embora o seu objetivo seja proporcionar aos usuários a oportunidade de explorar as capacidades de vários modelos, também pode ser utilizada por elementos mal-intencionados para gerar conteúdo malicioso, reduzir a barreira de entrada para a engenharia de prompts e acelerar a iteração de scripts de ataque.

A emergência de modelos de linguagem sem restrições marca a presença de novos paradigmas de ataque na segurança cibernética, que são mais complexos, com maior escala e capacidades de automação. Esses modelos não só baixam o limiar de ataque, mas também trazem novas ameaças mais ocultas e enganosas.

Para enfrentar esses desafios, todas as partes do ecossistema de segurança precisam trabalhar em conjunto:

Aumentar o investimento em tecnologias de deteção, desenvolver capacidades para identificar e interceptar conteúdos de phishing gerados por modelos maliciosos, exploração de vulnerabilidades em contratos inteligentes e código malicioso.
Promover a construção da capacidade de prevenção de jailbreak de modelos, explorando mecanismos de marca d'água e rastreamento, a fim de rastrear a origem de conteúdos maliciosos em cenários críticos como finanças e geração de código.
Estabelecer normas éticas e mecanismos de regulamentação robustos para limitar, desde a raiz, o desenvolvimento e o abuso de modelos maliciosos.

Só através destes esforços multifacetados conseguimos, ao mesmo tempo, enfrentar eficazmente os desafios de segurança que surgem com o rápido desenvolvimento da tecnologia de inteligência artificial.

Ver original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

19 gostos