Data Preprocessing & Diffusion Modeling