今回のスナバログは、記念すべき第1回配信の「振り返り」と、エンジニアらしく「配信作業を技術で解決しよう」という自動化プロジェクトの立ち上げについてお話ししています。
------------------------------------------
前回の反省会:意外と好評?でも課題も山積み
まずは恐る恐る公開した第1回配信のフィードバックからスタート。
- 「早口な語り口がAIっぽくなくて逆に良い」という嬉しい評価
- BGMがないことによる「無音の緊張感」問題
- 自分の声を聞いた時のなんとも言えない違和感
など、リアルな感想を共有しました。とりあえず、編集の手間を増やさないためにBGMはまだ見送りますが、「タイトルコール」くらいは入れて番組っぽくしよう!という結論になりました。ちなみに初回のユニークリスナーは6名でした。聞いてくれた方、本当にありがとうございます!
------------------------------------------
現状の泥臭い作業工程(As-Is) 実は今の配信、裏側ではかなり手作業なんです。
音声を録音して、NotebookLMに食わせて文字起こしして、タイトルと説明文を考えて、Spotify for Podcastersに入稿して…というフローを回しています。
「エンジニアなら、ここも自動化したいよね?」
ということで、プロジェクトが動き出しました。
------------------------------------------
GCP × Gemini で目指す「完全自動化」(To-Be)
目指すは「音声ファイルをアップロードするだけ」で、文字起こしから配信公開まで完了する世界。 技術選定の結果、AWSやAzureではなく、Google Cloud Platform (GCP) を採用することに決定しました!
- Gemini APIとの親和性が高い
- チームとしての新しい技術習得(リスキリング)
これらを理由に、GCP上に自動化パイプラインを構築していきます。
次回からはいよいよ開発フェーズへ。GitHubでタスク管理しながら進めていく様子も共有していきますので、開発の裏側にご興味ある方もぜひお聴きください!