🤖 recommendation systems, LLM, large langurage model - liqihui02 · Scour

Consistent Probabilistic Social Choice Revisited

🎮Q-Learning Academic

A Regret Minimization Framework on Preference Learning in Large Language Models

🤖reinforcement learning, deep learning, machine learning Academic

Traits Run Deeper: Trait-Specific Asymmetric Fusion for Personality Assessment

🤖Transformers Academic

SkelDPO: A Skeleton-Guided Direct Preference Optimization Framework for Efficient Code Generation

🎯RLHF Academic

ARM: An AutoRegressive Large Multimodal Model with Unified Discrete Representations

🤖reinforcement learning, deep learning, machine learning Academic

Beyond Rubrics: Exploration-Guided Evaluation Skills for Reward Modeling

🎯RLHF Academic

Adaptive Loss Balancing for Noise-Robust GRPO in Generative Recommendation

📚Information Retrieval Academic

SIDInspector: A Mapping-First Diagnostic Resource for Semantic-ID Tokenizers

📚Information Retrieval Academic

DynaCF: Mitigating Shortcut Learning in Reward Models via Dynamic Counterfactual Sensitivity

🔗Causal Inference Academic

DREAM: Dynamic Refinement of Early Assignment Mappings

🔗Causal Inference Academic

Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions

🎯RLHF Academic

SSRLive: Live Streaming Recommendation with Dynamic Semantic ID

📚Information Retrieval Academic

STELLAR: Spatio-Temporal Environmental Learning with Latent Alignment and Refinement for Long-Tailed Species Distribution Modeling

🤖reinforcement learning, deep learning, machine learning Academic

Generalized Rank-based Evaluation for Knowledge Graph Completion: Perspectives, Framework, and Analyses

🔍RAG Academic

Gryphon: A Unified Architecture for Semantic-ID Generation and Item-Level Scoring in Industrial Recommendations

📚Information Retrieval Academic

Log in to enable infinite scrolling