Listen

Description

今回はAnthropic CEOのDario Amodeiが書いた『The Urgency of Interpretability』の感想戦をしました。



https://youtu.be/RHetb_whynA を見てからだとより楽しめます。



【目次】


(00:00) アラインメント研究を進めるAIが生まれる?


(00:45) 2026年は「AIアラインメントの年」になる !?


(04:35) AIと人類の未来のための「2つのレース」


(07:07) 「2つのレース」にどうやって貢献するのか



【参考文献】


- https://www.darioamodei.com/post/the-urgency-of-interpretability


- https://openai.com/index/language-models-can-explain-neurons-in-language-models/


- https://transformer-circuits.pub/2025/attribution-graphs/biology.html


- https://www.anthropic.com/research/exploring-model-welfare


- https://youtu.be/pyXouxa0WnY?si=19FEKkB4Nt-MNS1U


- https://techstartups.com/2025/04/18/anthropic-backs-goodfire-in-50m-series-a-to-decode-ai-models-marking-first-ever-startup-investment/


- https://alignment.anthropic.com/


- https://alignment.anthropic.com/2025/introducing-safeguards-research-team/


- https://www.anthropic.com/research/claude-character


- https://www.anthropic.com/research/tracing-thoughts-language-model


- https://www.youtube.com/watch?v=ZP_N4q5U3eE


- https://axrp.net/episode/2023/07/27/episode-24-superalignment-jan-leike.html




【起業の履歴書について】


起業の履歴書は「偉大な企業を作り上げた起業家やその企業の歴史や哲学 📚」を掘り下げたり「スタートアップのテクノロジートレンド 💻」について話すチャンネルです!



<ホスト>


・East Ventures 村上雄也 - https://twitter.com/yu8muraka3


・伊藤工太郎 - https://twitter.com/etaroid



<Podcast>


Spotify - https://open.spotify.com/show/5ryodBEEOn66Wk7H2Sl8zF


Apple - https://podcasts.apple.com/jp/podcast/kigyo-no-rirekisho/id1767313170



【お問い合わせ】


起業の相談やお仕事の依頼は「下記お問い合わせフォーム 📋」または「上記XアカウントのDM 📮」にお送りください!



https://forms.gle/hYZojSEgvqis8Pys5



取り扱って欲しいテーマのリクエストなどもお待ちしております!