🔤 Tokenization - jhcha.oyo · Scour

LDARNet: DNA Adaptive Representation Network with Learnable Tokenization for Genomic Modeling

📝NLP Academic

Vibe Diaries: Training Nanochat

vibediary.dev··Hacker News

The PM’s Playbook for Shipping AI Features That Actually Work in Production

📊Statistics Blog

How Far Apart Does a Model Think Its Tokens Are?

⚡Speculative Decoding

lesswrong.com·

Aperio: Lightweight search engine in Rust – GBs of data in < 1ms, < 256MB RAM

🔍Information Retrieval Code

github.com··Hacker News, r/opensource

AdaTok: Self-Budgeting Image Tokenization with Quality-Preserving Dynamic Tokens

🎨Generative AI Academic

Less-relevant results

The Read Model Zoo: Projections Beyond Tables - EventSourcingDB

📊Data Science Blog Reference

docs.eventsourcingdb.io··Hacker News

Optimality of FSQ Tokens for Continuous Diffusion for Categorical Data with Application to Text-to-Speech

🤖AI Academic

A Taxonomy of Real-World Asset Tokenization for Blockchain-Based Financial Infrastructure

📝NLP Academic

DREAM: Dynamic Refinement of Early Assignment Mappings

🎯Recommender Systems Academic

harshuljain13/llm-inference-at-scale: A Practitioner handbook for production llm serving.

🤖AI Code

github.com··Hacker News

UniDexTok: A Unified Dexterous Hand Tokenizer from Real Data

🦾Robotics Academic

Steganography Without Modification: Hidden Communication via LLM Seeds

📝NLP Academic

arxiv.org··Hacker News

Neural Field Tokenizations with Hierarchy and Spatial Locality Priors

👁️Computer Vision Academic

Balancing Image Compression and Generation with Bootstrapped Tokenization

📝NLP Academic

LongMoE: Longitudinal Multimodal Learning via Trajectory-Aware Mixture-of-Experts

📝NLP Academic

CleanCodec: Efficient and Robust Speech Tokenization via Perceptually Guided Encoding

📝NLP Academic

ChannelTok: Efficient Flexible-Length Vision Tokenization

📝NLP Academic

Priors Persist Through Suppression: A Stroop Paradigm for Lexical Override

✍️Prompt Engineering Academic

MeshTok: Efficient Multi-Scale Tokenization for Scalable PDE Transformers

📝NLP Academic

Log in to enable infinite scrolling