#4: Rubberducks Generating Images
今回はマサが画像生成AIの歴史、技術、応用について話します。
- (00:00) イントロ
- (00:17) サップをした話
- (01:02) ladybirdbrowserが後継言語としてSwiftを採用
- (03:30) FoundationDB
- (07:46) 画像生成
- (10:33) 画像生成の歴史
- (10:35) Generative Adversarial Networks
- (14:02) DeepDream
- (16:33) Tensorflow DeepDream チュートリアル
- (18:41) Denoising Diffusion Probabilistic Models
- (20:17) DALL·E
- (20:31) DALL·E 2
- (20:40) Midjourney
- (20:59) CLIP
- (26:26) 画像生成の技術
- (26:40) Diffusers
- (28:59) U-Net
- (29:04) Variational autoencoders (VAE)
- (31:36) Img2Img
- (32:49) LoRA
- (37:29) ControlNet
- (42:05) 応用とこれから
- (42:11) CVPR 2024 トレンド
- (44:09) Inversion-Free Image Editing with Natural Language
- (46:48) Anomaly Generator
訂正
- latentを「ラテント」と読んでいましたが、正しくは「レイテント」でした。
- VAEのことを「Variable autoencoders」と言ってましたが、正しくは「Variational autoencoders」でした。
他にも間違いを見つけた場合は、Twitterの@Rubberduck_FMか@masaishi2001にDMください🙏