Rememberer

Project created for EECS 598 - Large Language Models, Winter 2024

We use a large language model as a semi-parametric reinforcement learning agent, testing its performance on WebShop, an online web store task. The agent is augmented with an external experience memory which allows it to iteratively refine and improve its own prompt. Relevant experiences are selected based on embedding similarity and template matching. Our best performing model achieves a 36.8% successful completion rate, and a trial is considered a success if the agent is able to accurately select the item along with all necessary category attributes before clicking 'buy now'.

Video Demo

final-proj-demo-video-lowres.mov

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
Rememberer		Rememberer
WebShop		WebShop
llama3		llama3
.gitignore		.gitignore
README.md		README.md
final-proj-demo-video-lowres.mov		final-proj-demo-video-lowres.mov
final-proj-demo-video.mov		final-proj-demo-video.mov
generated_Instructions.txt		generated_Instructions.txt
human_instructions.txt		human_instructions.txt
rememberer-notes.rtf		rememberer-notes.rtf
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Rememberer

Video Demo

About

Releases

Packages

Contributors 2

Languages

oliveraw/rememberer

Folders and files

Latest commit

History

Repository files navigation

Rememberer

Video Demo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages