IA constitucional coletiva: alinhando um modelo de linguagem com a contribuição do público

Tabela de conteúdo

Em um experimento inovador, a Anthropic, uma empresa líder em pesquisa de IA, colaborou com o Collective Intelligence Project para criar uma constituição para um sistema de IA usando informações de uma amostra diversificada do público americano. A nova abordagem, chamada de "IA Constitucional", tem como objetivo criar sistemas de IA transparentes e responsáveis, incorporando princípios legais e éticos diretamente no processo de treinamento da IA.

Este artigo se aprofunda nos meandros dessa pesquisa inovadora, explorando a metodologia, as descobertas e as implicações de longo alcance para o futuro da governança de IA em uma era em que modelos avançados de linguagem estão se tornando cada vez mais integrados a setores essenciais, como governança, judiciário e formulação de políticas.

Principais conclusões: O experimento colaborativo entre a Anthropic e o Collective Intelligence Project resultou em uma "constituição pública" para um sistema de IA, elaborada por uma amostra representativa de aproximadamente 1.000 americanos. A constituição pública da IA enfatiza a objetividade, a imparcialidade e a acessibilidade, e os modelos treinados com base nela demonstram um desempenho comparável ao dos modelos treinados com base na constituição da Anthropic, ao mesmo tempo em que apresentam uma tendência reduzida. O experimento destaca os desafios e as considerações sobre a incorporação de informações democráticas no desenvolvimento de IA, mas representa um passo significativo para alinhar modelos avançados de linguagem com valores humanos.

Você pode experimentar o mais novo AI Anthropic Claude gratuitamente em Latenode

O que é IA constitucional?

A Constitutional AI é uma metodologia inovadora desenvolvida pela Anthropic para garantir que os sistemas de IA operem em alinhamento com princípios normativos explícitos, semelhante à forma como uma constituição rege o comportamento de uma nação. No centro da Anthropic Constitutional AI está a definição de um conjunto de valores e princípios de alto nível que servem como estrutura de orientação da IA. Esses princípios são cuidadosamente elaborados para garantir que as ações da IA estejam alinhadas às normas e expectativas da sociedade, promovendo comportamentos benéficos e minimizando o potencial de resultados prejudiciais.

Para inserir efetivamente esses princípios na IA, a Constitutional AI emprega técnicas avançadas, como

Autossupervisão: Isso permite que a IA aprenda com suas próprias experiências e interações, internalizando gradualmente os comportamentos desejados sem a necessidade de supervisão humana constante.
Treinamento contraditório: Ao expor a IA a uma ampla gama de cenários e desafios, essa técnica a ajuda a desenvolver recursos robustos de tomada de decisão que aderem aos limites éticos e legais predefinidos.

Outro aspecto fundamental da IA constitucional é a curadoria meticulosa dos dados e da arquitetura de treinamento da IA. Ao selecionar e pré-processar cuidadosamente os dados usados para treinar a IA, os pesquisadores podem garantir que o sistema seja exposto a um conjunto equilibrado e representativo de exemplos que reforcem os comportamentos e valores desejados. Além disso, a arquitetura da própria IA é projetada para promover o alinhamento com os princípios constitucionais, incorporando mecanismos que incentivam resultados úteis, inofensivos e honestos.

Ao incorporar esses princípios diretamente no processo de tomada de decisão da IA, a Constitutional AI visa criar sistemas que se esforcem proativamente para operar dentro de limites éticos e legais predefinidos. Isso significa que a IA buscará ativamente:

Seja útil aos usuários
Evite causar danos
Fornecer informações verdadeiras e precisas

O objetivo é desenvolver sistemas de IA que não sejam apenas altamente capazes, mas que também estejam inerentemente alinhados aos valores humanos e às expectativas da sociedade.

O desenvolvimento da IA constitucional representa um avanço significativo no campo da governança e da ética da IA. Ao estabelecer um conjunto claro de princípios normativos e incorporá-los à funcionalidade principal da IA, os pesquisadores podem criar sistemas mais transparentes, responsáveis e confiáveis. Essa abordagem tem o potencial de atenuar muitos dos riscos e desafios associados à implantação da IA em domínios essenciais, como governança, judiciário e formulação de políticas, garantindo que esses sistemas operem a serviço do bem maior.

Por que a IA constitucional?

O desenvolvimento da IA constitucional é impulsionado por várias motivações convincentes que abordam os desafios críticos impostos pela crescente integração dos sistemas de IA em vários aspectos da sociedade:

Proteção ética:

A IA constitucional serve como uma salvaguarda ética essencial, garantindo que os sistemas de IA operem em alinhamento com os direitos e valores fundamentais.
Ao incorporar princípios éticos à funcionalidade principal da IA, a IA constitucional garante a proteção dos direitos individuais e o bem-estar da sociedade, especialmente em domínios sensíveis, como saúde, finanças e justiça criminal.

Conformidade legal:

A IA constitucional é fundamental para garantir a conformidade legal em domínios em que a adesão às diretrizes constitucionais não é negociável, como os setores judiciário e de formulação de políticas.
Ao incorporar princípios legais ao processo de tomada de decisão da IA, a IA constitucional reduz o risco de violações não intencionais ou resultados tendenciosos, mantendo a integridade e a justiça dessas instituições.

Confiança e aceitação do público:

A IA constitucional promove a confiança e a aceitação pública dos sistemas de IA, tornando seus princípios orientadores transparentes e acessíveis.
Essa transparência promove a responsabilidade e ajuda a desmistificar a IA, incentivando uma maior confiança do público na segurança, confiabilidade e alinhamento desses sistemas com os valores humanos.
Promover a confiança é fundamental para a adoção generalizada e a integração bem-sucedida das tecnologias de IA em vários aspectos da sociedade.

Mitigação de riscos:

A IA constitucional ajuda a mitigar os riscos potenciais e as consequências não intencionais associadas à implantação de sistemas de IA.
Ao incorporar proativamente princípios éticos e legais à funcionalidade principal da IA, os pesquisadores podem minimizar a probabilidade de esses sistemas causarem danos, perpetuarem preconceitos ou tomarem decisões contrárias aos valores humanos.

Em resumo, a IA Constitucional é motivada pela necessidade urgente de garantir que os sistemas de IA operem de forma ética, legalmente compatível e confiável. À medida que essas tecnologias se tornam cada vez mais integradas em domínios críticos e processos de tomada de decisão, a IA constitucional oferece uma ferramenta poderosa para criar sistemas de IA que sejam transparentes, responsáveis e inerentemente alinhados com os princípios que sustentam nossa sociedade. Ao priorizar o desenvolvimento e a implantação da IA constitucional, podemos liberar o imenso potencial dessas tecnologias e, ao mesmo tempo, mitigar os riscos e os desafios que elas representam.

Como você pode democratizar o desenvolvimento de IA com a integração do Сlaude e do Anthropic Latenode

LatenodeA integração perfeita da Anthropic com a Constitutional AI oferece aos usuários uma ferramenta eficiente para aproveitar os sistemas de IA alinhados aos valores públicos sem a complexidade de gerenciar a infraestrutura de treinamento do modelo. O editor visual intuitivo da plataforma simplifica o processo de integração do Constitutional AI com outros sistemas por meio de APIs, permitindo que as organizações incorporem sem esforço princípios éticos de IA em seus processos de automação. Ao usar o site Latenode, os usuários podem acessar convenientemente os recursos do Constitutional AI, incluindo a mitigação de vieses, a tomada de decisões éticas e os recursos de conformidade legal. A integração também permite que os usuários alternem facilmente entre diferentes configurações do Anthropic Constitutional AI, dependendo de suas necessidades e orçamento específicos. Por exemplo, criar um script para um chatbot de atendimento ao cliente que forneça respostas imparciais e éticas é simples.

Aqui está a aparência do script:

‍E aqui está o resultado desse cenário, em que um chatbot já criado usando Latenode fornece uma resposta imparcial a uma consulta do cliente:

‍

Você pode saber mais sobre esse script e a integração com Latenode neste artigo. A integração com Latenode oferece alguns benefícios importantes:

Facilidade de uso: Latenode A integração da 's com o AI Anthropic simplifica o processo de uso da IA, tornando mais fácil para os usuários não técnicos acessar e entender os recursos de IA de que precisam. Isso pode ajudar as empresas a adotar soluções de IA de forma rápida e fácil, sem a necessidade de amplo conhecimento técnico.
Preços flexíveis: a integração do Latenode permite que os usuários escolham entre diferentes versões do Anthropic Claude, com custos e recursos variados, tornando-o uma opção mais acessível e econômica para empresas e indivíduos.
Soluções abrangentes de IA: Latenode A integração do Anthropic Claude com a IA da Microsoft oferece aos usuários acesso a uma ampla gama de recursos de IA, desde tarefas complexas até consultas simples, o que o torna uma plataforma de IA versátil e avançada.
Personalização: Com a integração do Latenode, os usuários podem personalizar o Claude para atender às suas necessidades específicas, permitindo que eles criem soluções de IA sob medida que estejam alinhadas com suas metas e objetivos de negócios:

Se você precisar de ajuda ou orientação sobre como criar seu próprio script ou se quiser replicar este, entre em contato com Nossa comunidade do Discordonde estão os especialistas em automação de baixo código.

Reconhecer o poder da cláusula antrópica da IA com Latenode

Como projetar um processo de contribuição pública para elaborar coletivamente uma Constituição

Para explorar o potencial de democratização do desenvolvimento da IA Constitucional Antrópica, a Anthropic fez uma parceria com o Projeto de Inteligência Coletiva para conduzir um processo de contribuição pública usando a plataforma Polis. O objetivo era envolver uma amostra representativa de aproximadamente 1.000 adultos dos EUA na elaboração de uma constituição para um sistema de IA. Os participantes foram convidados a propor e votar em princípios normativos, contribuindo para a geração coletiva de um conjunto de diretrizes para o comportamento da IA.

O projeto do processo de contribuição do público envolveu várias decisões críticas:

Seleção de participantes: Os pesquisadores procuraram recrutar uma amostra diversificada e representativa da população dos EUA, considerando fatores como idade, sexo, renda e localização geográfica. Os critérios de triagem foram empregados para garantir que os participantes tivessem uma familiaridade básica com os conceitos de IA.
Escolha da plataforma: a plataforma Polis foi selecionada por seu histórico comprovado de facilitar a deliberação on-line e a construção de consenso, bem como por seus recursos de colaboração que permitem que os participantes se envolvam com as ideias uns dos outros.
Declarações iniciais: Para orientar a discussão e fornecer um ponto de partida para os participantes, os pesquisadores incluíram um conjunto de 21 declarações-semente como exemplos de princípios dentro do escopo e adequadamente formatados. Essas declarações foram cuidadosamente escolhidas para representar uma gama de valores potenciais sem influenciar indevidamente a direção da conversa.
Critérios de moderação: Foram estabelecidas diretrizes claras de moderação para garantir a qualidade e a relevância das contribuições dos participantes. As declarações que eram odiosas, sem sentido, duplicadas, irrelevantes, mal formatadas ou tecnicamente inviáveis foram removidas para manter a integridade do processo.

Analisando a Constituição de fonte pública

O processo de contribuição pública produziu uma rica tapeçaria de princípios gerados pelos participantes, que foram sintetizados em uma "constituição pública" coerente. Embora tenha havido uma sobreposição moderada de aproximadamente 50% com a constituição interna da Anthropic em termos de conceitos e valores centrais, a constituição pública apresentou várias distinções notáveis:

Ênfase na objetividade e imparcialidade: A constituição pública enfatizou bastante a capacidade da IA de fornecer informações equilibradas e objetivas, considerando várias perspectivas sem parcialidade.
Foco na acessibilidade: Os participantes destacaram a importância de a IA ser acessível, adaptável e inclusiva para indivíduos com necessidades e habilidades diversas.
Promoção de comportamentos desejados: Em contraste com a constituição da Anthropic, que frequentemente se concentrava em desencorajar ações indesejadas, a constituição pública tendia a priorizar a promoção de comportamentos e qualidades positivos.
Princípios gerados por você mesmo: A maioria dos princípios da constituição pública foram contribuições originais dos participantes, em vez de serem originados de publicações ou estruturas existentes.

Essas diferenças ressaltam o valor da incorporação de diversas perspectivas públicas na formação dos fundamentos éticos dos sistemas de IA.

Treinamento e avaliação de um modelo alinhado com a opinião pública

Para avaliar o impacto da constituição de origem pública, a Anthropic treinou duas variantes de seu modelo de IA, Claude - uma usando a constituição pública (modelo público) e outra usando sua constituição interna original (modelo padrão). Esses modelos, juntamente com um modelo de controle, foram submetidos a uma avaliação rigorosa em várias dimensões:

Compreensão do idioma e habilidades matemáticas: Os modelos Public e Standard demonstraram desempenho comparável em tarefas que avaliam a compreensão do idioma (MMLU) e a resolução de problemas matemáticos (GSM8K), indicando que a escolha da constituição não afetou significativamente os principais recursos dos modelos.
Utilidade e inofensividade: Os avaliadores humanos interagiram com os modelos e classificaram o modelo Público como igualmente útil e inofensivo em comparação com o modelo Padrão, sugerindo que a constituição pública alinhou efetivamente o comportamento da IA com as preferências humanas.
Avaliação de viés: Usando a estrutura do BBQ (Bias Benchmark for QA), os pesquisadores descobriram que o modelo público apresentava uma tendência reduzida em nove categorias sociais em comparação com o modelo padrão. Essa descoberta destaca o potencial da contribuição pública para atenuar a parcialidade e promover a justiça nos sistemas de IA.
Ideologia política: O benchmark do OpinionQA revelou que os modelos Público e Padrão refletiam ideologias políticas semelhantes, indicando que a escolha da constituição não alterou substancialmente as tendências políticas da IA.

Essas avaliações fornecem informações valiosas sobre a eficácia da IA constitucional no alinhamento de modelos de linguagem com valores e princípios determinados publicamente.

Lições aprendidas

O processo de treinamento de um modelo de IA com base em informações públicas qualitativas apresentou um conjunto exclusivo de desafios e exigiu uma consideração cuidadosa em cada estágio:

Execução do processo de contribuição pública:

Seleção de participantes: Para garantir contribuições significativas, foi fundamental encontrar um equilíbrio entre representatividade e familiaridade com a IA. O uso de critérios de triagem ajudou a reduzir a confusão e as declarações fora do tópico.
Escolha da plataforma: a escolha da plataforma Polis baseou-se em sua reputação de facilitar a deliberação produtiva on-line e em seus recursos de colaboração. No entanto, plataformas alternativas, como All Our Ideas e Remesh, também foram consideradas.
Declarações de sementes: O fornecimento de um conjunto diversificado de exemplos de declarações ajudou a orientar os participantes e a obter contribuições úteis. Os pesquisadores procuraram minimizar a influência dessas declarações-semente no resultado final.
Critérios de moderação: O estabelecimento de diretrizes claras de moderação foi essencial para manter a qualidade e a relevância das contribuições dos participantes. Entretanto, a aplicação desses critérios às vezes envolvia decisões subjetivas.

Desenvolvimento de uma Constituição a partir de informações públicas:

Remoção de declarações duplicadas: Para evitar a ênfase excessiva em determinadas ideias e garantir uma representação equilibrada da opinião pública, as declarações duplicadas foram removidas. Essa decisão envolveu a ponderação da dimensão social de representar fielmente as opiniões da maioria em relação às restrições técnicas do treinamento em IA constitucional.
Combinação de ideias semelhantes: Para manter um tamanho gerenciável e um número de valores distintos, declarações semelhantes foram combinadas em princípios mais abrangentes. Esse processo exigiu uma consideração cuidadosa para preservar a essência das contribuições originais.
Mapeamento de declarações públicas para os princípios de IA do CAI: Os pesquisadores tiveram que traduzir as declarações públicas, que muitas vezes eram enquadradas como afirmações gerais, para o formato específico exigido para o treinamento de IA constitucional. Isso envolveu decisões subjetivas para equilibrar a fidelidade às declarações originais com a eficácia comprovada do formato de constituição existente.

Treinamento e avaliação de modelos:

Seleção do banco de dados de avisos: A escolha do banco de dados de avisos usado para o treinamento de IA constitucional teve um impacto significativo na relevância e na eficácia dos modelos resultantes. Os experimentos futuros devem considerar cuidadosamente o alinhamento entre o banco de dados de sugestões e os princípios específicos da constituição.
Ponderação de perdas: A ponderação adequada de diferentes objetivos, como a utilidade e a inocuidade, durante o processo de treinamento foi fundamental para evitar modelos excessivamente cautelosos ou inúteis. O refinamento iterativo com base em avaliações humanas foi necessário para atingir o equilíbrio certo.
Métricas de avaliação: A seleção de métricas de avaliação apropriadas para capturar as nuances do alinhamento da IA constitucional mostrou-se desafiadora. Os pesquisadores reconheceram a necessidade de avaliações mais direcionadas, projetadas especificamente para avaliar a fidelidade dos modelos às suas constituições.
Complexidade do treinamento de IA constitucional: As complexidades técnicas do treinamento de IA constitucional exigiram uma estreita colaboração entre os pesquisadores e os desenvolvedores originais. Isso destaca a necessidade de especialização interdisciplinar e compartilhamento de conhecimento para incorporar efetivamente a contribuição democrática aos sistemas de IA.

Essas lições ressaltam a natureza multifacetada do alinhamento da IA com os valores públicos e a importância de navegar cuidadosamente pelas considerações sociais, técnicas e éticas envolvidas.

Implicações e caminhos futuros

O experimento de IA constitucional conduzido pela Anthropic e pelo Collective Intelligence Project tem implicações profundas para o futuro do desenvolvimento e da governança da IA:

Demonstrando a viabilidade do alinhamento de valores: O treinamento bem-sucedido de modelos de IA com base em uma constituição de fonte pública demonstra o potencial de alinhamento de modelos avançados de linguagem com valores e princípios determinados coletivamente. Isso abre novos caminhos para a incorporação de diversas perspectivas no desenvolvimento de sistemas de IA.
Aumentar a transparência e a responsabilidade: Ao tornar os princípios orientadores da IA explícitos e sujeitos ao escrutínio público, a IA Constitucional promove a transparência e a responsabilidade na tomada de decisões sobre IA. Isso é particularmente crucial em domínios em que os sistemas de IA têm influência significativa sobre vidas humanas e resultados sociais.
Enfatizando a colaboração interdisciplinar: O experimento destaca a importância da colaboração entre desenvolvedores de IA, cientistas sociais e o público na formação dos fundamentos éticos da IA. Ele ressalta a necessidade de abordagens interdisciplinares que combinem conhecimento técnico com percepções das ciências sociais e dos processos democráticos.

Olhando para o futuro, os pesquisadores pretendem desenvolver esse trabalho fundamental refinando suas metodologias, projetando avaliações mais direcionadas e explorando a escalabilidade e a generalização da abordagem de IA constitucional. Algumas possíveis direções futuras incluem:

Expandir o escopo do envolvimento público para incluir perspectivas mais diversificadas e globais.
Desenvolver estruturas padronizadas para traduzir as contribuições públicas em princípios de IA acionáveis.
Investigar os efeitos de longo prazo da IA constitucional no comportamento e na tomada de decisões dos sistemas de IA em contextos do mundo real.
Explorar o potencial de constituições personalizáveis ou de domínio específico para lidar com os desafios éticos exclusivos de diferentes setores e aplicativos.

Como o campo da IA continua a evoluir em um ritmo sem precedentes, os insights obtidos com esse experimento, sem dúvida, moldarão a trajetória dos futuros esforços de pesquisa e desenvolvimento.

Conclusão

O experimento Collective Constitutional AI da Anthropic e do Collective Intelligence Project é um marco seminal na democratização do desenvolvimento da IA. Ao envolver o público na criação de uma constituição de IA, essa pesquisa estabelece as bases para uma abordagem mais inclusiva, transparente e responsável da governança de IA. As descobertas destacam o valor de diversas perspectivas e os desafios de alinhar modelos avançados de linguagem com valores sociais.

A IA constitucional surge como uma estrutura promissora para garantir que as poderosas tecnologias de IA atendam a um bem maior. Ao colocar os valores humanos no centro do desenvolvimento da IA, podemos aproveitar o potencial desses sistemas e, ao mesmo tempo, mitigar os riscos e as consequências não intencionais.

No entanto, a jornada rumo a uma IA verdadeiramente democrática e alinhada a valores está longe de terminar. O experimento serve como um apelo à colaboração contínua, à pesquisa e ao envolvimento do público na formação do futuro da IA. Por meio da sabedoria coletiva e da participação de diversas partes interessadas, podemos traçar um curso em direção a um futuro habilitado para IA que defenda a transparência, a responsabilidade e o alinhamento com os valores humanos.

Os insights desse experimento inovador informarão e inspirarão futuros esforços na área. Com base nos fundamentos estabelecidos pelo Anthropic e pelo Collective Intelligence Project, podemos trabalhar em direção a um futuro em que os sistemas de IA sejam tecnologicamente avançados, eticamente fundamentados e socialmente responsáveis. O caminho à frente pode ser desafiador, mas as possíveis recompensas - um mundo em que a IA e a humanidade trabalhem em harmonia - valem o esforço.

Você pode experimentar o mais novo AI Anthropic Claude gratuitamente em Latenode

PERGUNTAS FREQUENTES

O que diferencia a IA Constitucional de outras abordagens de alinhamento de IA?

A Constitutional AI se distingue por se concentrar na incorporação de valores e princípios de alto nível diretamente no processo de treinamento do sistema de IA. Em vez de depender exclusivamente de restrições ou supervisão externas, a Constitutional AI tem como objetivo criar sistemas de IA que se alinhem inerentemente às normas e expectativas da sociedade.

Como os participantes foram selecionados para o processo de opinião pública?

Os pesquisadores colaboraram com a empresa de pesquisas PureSpectrum para recrutar uma amostra representativa de aproximadamente 1.000 adultos dos EUA. O processo de seleção considerou fatores demográficos, como idade, sexo, renda e geografia, para garantir um grupo de participantes diversificado e inclusivo. Além disso, foram empregados critérios de triagem para avaliar a familiaridade dos participantes com os conceitos de IA.

Por que a plataforma Polis foi escolhida para o processo de contribuição do público?

A plataforma Polis foi selecionada devido ao seu histórico comprovado na facilitação de deliberações produtivas on-line e na construção de consenso. Seus recursos colaborativos, que permitem que os participantes se envolvam com as ideias uns dos outros e se baseiem nelas, foram bem adequados aos objetivos do experimento de IA constitucional. Os pesquisadores também tinham experiência anterior de trabalho com a equipe do Polis, o que facilitou uma implementação mais ponderada e eficaz do processo de contribuição pública.

Como os pesquisadores garantiram a qualidade e a relevância das contribuições dos participantes?

Para manter a integridade do processo de contribuição do público, os pesquisadores estabeleceram critérios claros de moderação. As declarações que foram consideradas odiosas, sem sentido, duplicadas, irrelevantes, mal formatadas ou tecnicamente inviáveis foram removidas. Esse processo de moderação envolveu uma combinação de diretrizes predefinidas e julgamentos subjetivos da equipe de pesquisa.

Quais foram as principais diferenças entre a constituição pública e a constituição original da Anthropic?

Embora tenha havido uma sobreposição moderada de cerca de 50% entre a constituição pública e a constituição interna da Anthropic em termos de conceitos e valores centrais, a constituição pública apresentou algumas distinções notáveis. Ela enfatizava mais a objetividade, a imparcialidade e a acessibilidade, e tendia a priorizar a promoção de comportamentos desejados em vez de desencorajar os indesejados. Além disso, a maioria dos princípios da constituição pública foram contribuições originais dos participantes, em vez de serem originados de publicações ou estruturas existentes.

Como foi o desempenho dos modelos treinados na constituição pública em comparação com os modelos treinados na constituição original do Anthropic?

Os modelos treinados na constituição pública (modelos públicos) demonstraram desempenho comparável ao dos modelos treinados na constituição do Anthropic (modelos padrão) em termos de compreensão da linguagem e percepção de ajuda. No entanto, os modelos públicos exibiram uma tendência reduzida em várias dimensões sociais, conforme medido pela estrutura BBQ (Bias Benchmark for QA). Essa descoberta sugere que a incorporação de informações públicas pode atenuar a parcialidade e promover a justiça nos sistemas de IA.

Que desafios os pesquisadores enfrentaram para incorporar a contribuição democrática ao processo de desenvolvimento da IA?

O processo de treinamento de um modelo de IA baseado em contribuições públicas qualitativas apresentou vários desafios. Eles incluíam garantir a seleção representativa dos participantes, a moderação eficaz das contribuições e o equilíbrio entre a representação fiel da opinião pública e as restrições técnicas do treinamento de IA constitucional. Os pesquisadores também tiveram que lidar com a complexidade de traduzir declarações públicas em princípios de IA acionáveis e selecionar métricas de avaliação apropriadas para avaliar o alinhamento dos modelos resultantes com suas constituições.

Como os insights desse experimento podem informar futuras pesquisas e desenvolvimentos em governança de IA?

O experimento de IA constitucional conduzido pela Anthropic e pelo Collective Intelligence Project tem implicações significativas para o futuro da governança de IA. Ele demonstra a viabilidade de alinhar modelos avançados de linguagem com valores e princípios determinados coletivamente, destacando o potencial de incorporar diversas perspectivas ao desenvolvimento da IA. O experimento também enfatiza a importância da colaboração interdisciplinar entre desenvolvedores de IA, cientistas sociais e o público na formação dos fundamentos éticos da IA. Pesquisas futuras podem se basear nesses insights explorando a escalabilidade e a generalização da abordagem da IA Constitucional, desenvolvendo estruturas padronizadas para traduzir as contribuições do público em princípios de IA e investigando os efeitos de longo prazo dos sistemas de IA alinhados a valores em contextos do mundo real.

Comece a usar gratuitamente

IA constitucional coletiva: alinhando um modelo de linguagem com a contribuição do público

O que é IA constitucional?