added dockerfile and pip dependencies for OSD and LLM model compression workloads (!1) · Merge requests · Yue Pan / SEELAB-NRP · GitLab

Lanxiang Hu requested to merge llm_specd into main Oct 16, 2023

added dockerfiles and pip dependencies for:

Speculative decoding workload for efficient LLM inference.
Model post-training model compression workload (quantization for now) for LLM deployment.