Independent Science + Technology

Category: model-inference

When Context Becomes a Drug: The Engineering Highs and Hangovers of Long-Term LLM Memory

Post date November 5, 2025
Post author By Chirag Agrawal
Post categories In ai-addiction, ai-addiction-risks, ai-context-window, ai-engineering, computational-linguistics, llm, long-term-llm-memory, model-inference

When Context Becomes a Drug: The Engineering Highs and Hangovers of Long-Term LLM Memory

Post date November 5, 2025
Post author By Chirag Agrawal
Post categories In ai-addiction, ai-addiction-risks, ai-context-window, ai-engineering, computational-linguistics, llm, long-term-llm-memory, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Conclusion & Discussion

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Related Works

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Results for OPT 6.7B Model

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Results for Falcon 7B Model

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Results

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Optimized Data in DRAM

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Improving Throughput

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Load From Flash

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Read Throughput

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Large Language Models on Memory-Constrained Devices Using Flash Memory: Flash Memory & LLM Inference

Post date July 31, 2024
Post author By Knapsack
Post categories In data-transfer-efficiency, dram-optimization, flash-memory, hardware-aware-design, large-language-models, memory-constrained-devices, model-acceleration, model-inference

Nothing left to load.