Independent Science + Technology

Category: llm-training

Strategic LLM Training: Multi-Token Prediction’s Data Efficiency in Mathematical Reasoning

Post date July 23, 2025
Post author By Cosmological thinking: time, space and universal causation
Post categories In ai-evaluation, ai-optimization, llm-performance, llm-training, multi-token-llm, multi-token-prediction, natural-language-math, transformer-models

Unleashing LLM Training Efficiency: Multi-Token Prediction’s Near-Zero Overhead

Post date July 22, 2025
Post author By Cosmological thinking: time, space and universal causation
Post categories In computational-overhead, deep-learning-optimization, fsdp, llm-training, model-scalability, multi-token-prediction, next-token-prediction, training-efficiency

Multi-Token Prediction: Architecture for Memory-Efficient LLM Training

Post date June 3, 2025
Post author By Large Models (dot tech)
Post categories In ai-performance, inference-optimization, language-model-architecture, llm-training, memory-utilization, multi-token-prediction, self-speculative-decoding, transformer-efficiency

Share How You Collect Data to Train Your AI, Win From $2500 in the AI Writing Contest

Post date October 31, 2024
Post author By HackerNoon Writing Contests Announcements
Post categories In ai, ai-data-collection, ai-writing-contest, bright-ai-data, bright-data, data-collection-at-scale, llm-data-collection, llm-training

The Open-Source Libraries to Check Out for LLM Building

Post date June 26, 2024
Post author By AIport
Post categories In accelerate-llm-deployment, building-an-llm, faster-llm-inference, hackernoon-top-story, llm-training, python-libraries, top-llm-development-libraries, top-open-source-llm-libraries

YaFSDP – An LLM Training Tool That Cuts GPU Usage by 20% – Is Out Now

Post date June 22, 2024
Post author By Yandex
Post categories In good-company, gpu-utilization, imporve-llm-training, llm-fine-tuning, llm-optimization, llm-training, open-source-tools, what-is-yafsdp

Nothing left to load.