Início Tecnologia O pesquisador de segurança da Anthropic AI controlou a situação, ouviu e...

O pesquisador de segurança da Anthropic AI controlou a situação, ouviu e está claro o que deve ser feito

7
0

Até hoje, Mrinank Sharma period o chefe da equipe de pesquisa de salvaguardas da Anthropic, a empresa por trás do widespread chatbot de IA Claude. Ele deixou o cargo na segunda-feira e publicamente publicado a carta que ele compartilhou com sua equipe antes de partir, na qual expressava uma profunda preocupação com… alguma coisa.

No cartaSharma fala extensivamente sobre a contribuição para a segurança da IA, citando sucessos em seu papel, incluindo “compreender a bajulação da Al e suas causas; desenvolver defesas para reduzir os riscos do bioterrorismo assistido pela Al; realmente colocar essas defesas em produção; e escrever um dos primeiros casos de segurança da Al”. Seu projeto closing, escreveu ele, period “compreender como os assistentes de Al poderiam nos tornar menos humanos ou distorcer nossa humanidade”.

Ele também disse que o trabalho é mais importante do que nunca por causa de uma ameaça vaga e quase indefinida que surge no horizonte. “Descobri-me continuamente que estamos a avaliar a nossa situação. O mundo está em perigo. E não apenas por causa da Al, ou das armas biológicas, mas por toda uma série de crises interligadas que se desenrolam neste preciso momento”, escreveu ele.

Embora ele não cite esses perigos, ele deixou uma nota de rodapé, digamos útil, para explicar melhor: “Alguns chamam isso de ‘poli-crise’, sustentada por uma ‘meta-crise’”. Okay! Para entender melhor essa ideia, ele citou o livro “Primeiros Princípios e Primeiros Valores”, de David J. Temple, e é uma verdadeira toca de coelho para cair.

Algumas coisas sobre esse texto: primeiro, o subtítulo é “Quarenta e duas proposições sobre o humanismo cosmoerótico, a metacrise e o mundo vindouro”. O Humanismo CosmoErótico, de acordo com o Centro de Filosofia e Religião Mundial, é um “movimento filosófico mundial que visa reconstruir o colapso do valor no centro da cultura international” e “não é apenas uma teoria, mas um movimento que muda o próprio humor da Realidade”. Essas são definitivamente palavras colocadas em ordem.

Num esforço para simplificar o conceito de Humanismo CosmoErótico, basicamente postula que estamos a viver uma crise elementary da humanidade causada pela perda de uma compreensão partilhada do mundo e procura criar uma nova história partilhada que enquadra a evolução da humanidade como a “História de Amor do Universo”.

Em segundo lugar, o autor do livro, David J. Temple, não é realmente uma pessoa. É um pseudônimo que abrange uma coleção de escritores associados ao Centro de Filosofia e Religião Mundial, incluindo Marc Gafni e Zak Stein como autores principais. Gafni, vale notar, foi acusado de agressão sexual por múltiplas vítimasincluindo duas mulheres que estavam menor de idade no momento da suposta má condutae foi banido do movimento de renovação judaica do qual ele fez parte anteriormente. Talvez não seja o tipo de pessoa que você gostaria que estivesse no centro da elaboração da “história de amor” da sociedade.

De volta a Sharma, ele disse que, embora estivesse orgulhoso do trabalho que fez para proteger a IA, ele sabia que period hora de seguir em frente e parecia sugerir que talvez a Anthropic não estivesse à altura de sua imagem pública cuidadosamente selecionada como a “boa” empresa de IA. “Ao longo do meu tempo aqui, vi repetidamente como é difícil deixar verdadeiramente que os nossos valores governem as nossas ações”, escreveu ele. “Já vi isso dentro de mim mesmo, dentro da organização, onde enfrentamos constantemente pressões para deixar de lado o que é mais importante, e também em toda a sociedade em geral.”

O Gizmodo entrou em contato com a Anthropic para comentar a saída de Sharma, mas não recebeu resposta no momento da publicação.

Compreensivelmente, Sharma disse que queria fazer um trabalho que lhe permitisse agir de acordo com os seus princípios e manter a sua integridade. “É mantendo esta situação e ouvindo o melhor que posso que o que devo fazer fica claro”, escreveu ele. Então, que clareza ele encontrou, você deve estar se perguntando? Ele atuará como denunciante e compartilhará o que viu de dentro da indústria e da Anthropic, em specific? Talvez ele atue como uma voz proeminente para evitar que a IA seja usada de maneiras perigosas e imprudentes?

“Espero explorar um curso de poesia e me dedicar à prática do discurso corajoso”, escreveu ele. Boa sorte, cara.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui