O artigo apresenta "MacBehaviour", um pacote R que visa simplificar e padronizar a condução de experimentos comportamentais em uma vasta gama de Modelos de Linguagem Grande (LLMs), tratando-os como participantes em estudos psicológicos. O pacote foi desenvolvido para abstrair as complexidades de programação e protocolos de API, permitindo que pesquisadores se concentrem no design experimental para modelos como GPT, Claude e Llama. Para validar sua utilidade, os autores realizaram trĆŖs experimentos que replicaram a associação entre som e gĆŖnero em LLMs, demonstrando que esses modelos exibem tendĆŖncias de inferĆŖncia de gĆŖnero semelhantes Ć s humanas com base na fonologia de nomes. Os experimentos de validação utilizaram diferentes designs (mĆŗltiplos-testes-por-execução e um-teste-por-execução) e coleta de probabilidades de token, destacando a importĆ¢ncia da padronização dos procedimentos para garantir a comparabilidade e reprodutibilidade dos resultados em pesquisa de comportamento de mĆ”quina. Em suma, o pacote MacBehaviour oferece uma ferramenta acessĆvel e integrada para estudos de comportamento de LLM em diversas Ć”reas, como psicolinguĆstica e economia comportamental.