Listen

Description

今回は、「AIレビューが爆量に返ってきて人間がボトルネックになる問題」を起点に、AI駆動開発におけるレビュー体制と自動化について語っています。

僕たちのチームでは Codex、CodeRabbit、Claude、Devin の4つのAIレビュアーを導入しています。これらについてどのレビュアーの指摘が的確で、どれが参考程度でよいのかなど、各ツールの評価について2人の意見を話し合いました。

AIのレビューと修正を繰り返すうちに、1つのPRがコメント375件・約80コミットまで膨れ上がってしまい、人間が手動で付き合い続けるのは現実的ではないという課題も浮き彫りに。

後半では、阿部さんがこの課題を解決するためにGitHub CLIの仕組みに基づき、CLIの拡張機能を自作・公開した話や、sleepコマンドを使ってAIによるレビュー対応と再確認の自動イテレーションを回す仕組みなど、具体的な改善策に踏み込んでいます。
レビューの妥当性検証をどこまで自動化できるのか、お互い気づきの多い時間となりました。

▼CodeRabbit
https://www.coderabbit.ai/
▼Devin
https://devin.ai/
▼Github CLI
https://cli.github.com/
▼ 阿部さんが自作したGithub CLIの拡張機能
https://github.com/abekdwight/gh-pr-review-check
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/68dc82a9036795923c400b4f