Research

Articles

Dataset

September 2025

The first comprehensive dataset for training AI models to write complete novels with sophisticated reasoning.

The first comprehensive dataset for training AI models to write complete novels with sophisticated reasoning.

Research

December 2024

Most image captioning models optimize for readability, not accuracy. This post shows how I built a GPT-4V-level captioning model for synthetic data generation on consumer hardware.

Most image captioning models optimize for readability, not accuracy. This post shows how I built a GPT-4V-level captioning model for synthetic data generation on consumer hardware.

Create crazy stories, connect with us: