https://drive.google.com/drive/u/0/folders/1fUiElewCAgFbb5yPV_q1QhzyHHS0kpbX
<aside> ๐
ํ์ต ๋ฐ์ดํฐ์ ์ด ๋ณ๊ฒฝ๋๋ ๊ฒฝ์ฐ, ์ด์ ์ ํ์ตํ ํ๋ผ๋ฏธํฐ ๊ฐ๋ค์ด ์๋ฏธ์๊ฒ ๋๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํ ํ์ธํ๋์ด ์๋ ์ผ๋ถ ํ์ธํ๋ ์์ ๋ง์ ์งํํ๋ ๋ฐฉ๋ฒ๋ก ์ด ๋์๋ค.
์ผ๋ถ ํ๋ผ๋ฏธํฐ ๊ฐ๋ง์ ์ ๋ฐ์ดํธํ๊ณ ๋๋จธ์ง ๊ณ ์ (Freeze)
๋ชจ๋ ํ๋ผ๋ฏธํฐ์ Gradient๋ฅผ ์ ์ฅํ ํ์๊ฐ ์์ด VRAM ์๋ชจ๊ฐ ๊ฐ์๋๋ค </aside>
์ฅ์
ex) 7B Model + LoRA
HuggingFace PEFT ๋ผ์ด๋ธ๋ฌ๋ฆฌ
LoRA<aside> ๐
LoRA ( Low Rank Adaptation Fine Tuning )
LLM์ ์๋ก์ด task๋ ๋๋ฉ์ธ์ ๋ง๊ฒ ํจ์จ์ ์ผ๋ก ๋ฏธ์ธ์กฐ์ (fine-tuning)ํ๊ธฐ ์ํ ๊ธฐ๋ฒ์ด๋ค.
์ฌ์ ํ์ต๋ ๊ฐ์ค์น(W)๋ ๊ทธ๋๋ก ๋๊ณ , ๊ทธ ์์ โ์๊ณ ์ ์ฐจ์์ธ ์ด๋ํฐ ํ๋ ฌโ๋ง ์ถ๊ฐ๋ก ํ์ตํ๋ ๊ฒ์ด ํต์ฌ ์์ด๋์ด๋ค.

https://arxiv.org/pdf/2106.09685
$h = Wx โ h = (W + BA)x$
<aside> ๐
๋ ผ๋ฌธ: LoRA: Low Rank Adaptation of Large Language Models
github </aside>
์ฃผ์ ๋ด์ฉ