Progetto per 2/3 del voto.
Orale per 1/3 dei punti composto da:
- Presentazione (come se lo facessimo ad un cliente) di gruppo
- Orale singolo con domande del corso (teoria e strumenti visti)

L'obiettivo di questo progetto è creare un sistema basato su LLM Agents e deve dimostrare la capacità di ragionare, adattarsi a eventi esterni e comunicare in modo intelligente.

Installazione

Per l'installazione si può utilizzare un approccio tramite uv (manuale) oppure utilizzare un ambiente Docker già pronto (automatico).

Prima di avviare l'applicazione è però necessario configurare correttamente le API keys e installare Ollama per l'utilizzo dei modelli locali, altrimenti il progetto, anche se installato correttamente, non riuscirà a partire.

API Keys

Le API Keys puoi ottenerle tramite i seguenti servizi:

Google AI: Google AI Studio (gratuito con limiti)
Anthropic: Anthropic Console
DeepSeek: DeepSeek Platform
OpenAI: OpenAI Platform

Nota che alcune API sono gratuite con limiti di utilizzo, altre sono a pagamento. Google offre attualmente l'accesso gratuito con limiti ragionevoli.

Ollama (Modelli Locali)

Per utilizzare modelli AI localmente, è necessario installare Ollama:

1. Installazione Ollama:

Linux:

curl -fsSL https://ollama.com/install.sh | sh

macOS/Windows: Scarica l'installer da https://ollama.com/download/windows

2. GPU Support (Raccomandato): Per utilizzare la GPU con Ollama, assicurati di avere NVIDIA CUDA Toolkit installato:

Download: NVIDIA CUDA Downloads
Documentazione WSL: CUDA WSL User Guide

3. Installazione Modelli: Si possono avere più modelli installati contemporaneamente. Per questo progetto si consiglia di utilizzare il modello open source gpt-oss poiché prestante e compatibile con tante funzionalità. Per il download:

ollama pull gpt-oss:latest

Variabili d'Ambiente

1. Copia il file di esempio:

cp .env.example .env

2. Modifica il file .env creato con le tue API keys e il path dei modelli Ollama, inserendoli nelle variabili opportune dopo l'uguale e senza spazi:

GOOGLE_API_KEY=
ANTHROPIC_API_KEY=
DEEPSEEK_API_KEY=
OPENAI_API_KEY=
# Path dove Ollama salva i modelli (es. /home/username/.ollama su Linux)
OLLAMA_MODELS_PATH=

Opzione 1 UV

1. Installazione uv: Per prima cosa installa uv se non è già presente sul sistema:

# Windows (PowerShell)
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

2. Ambiente e dipendenze: uv installerà python e creerà automaticamente l'ambiente virtuale con le dipendenze corrette:

uv sync --frozen --no-cache

3. Run: Successivamente si può far partire il progetto tramite il comando:

uv run python src/app.py

Opzione 2 Docker

Alternativamente, se si ha installato Docker, si può utilizzare il Dockerfile e il docker-compose.yaml per creare il container con tutti i file necessari e già in esecuzione:

IMPORTANTE: Assicurati di aver configurato il file .env come descritto sopra prima di avviare Docker.

docker compose up --build -d

Il file .env verrà automaticamente caricato nel container grazie alla configurazione in docker-compose.yaml.

Applicazione

L'applicazione è attualmente in fase di sviluppo.

Aggiornamento del 19 Giugno 2024

Usando la libreria gradio è stata creata un'interfaccia web semplice per interagire con gli agenti. Gli agenti si trovano nella cartella src/app/agents e sono:

Market Agent: Recupera i dati di mercato (prezzi, volumi, ecc.). MOCK
News Agent: Recupera le notizie finanziarie più recenti utilizzando. MOCK
Social Agent: Analizza i sentimenti sui social media utilizzando. MOCK
Predictor Agent: Utilizza i dati raccolti dagli altri agenti per fare previsioni.

L'applicazione principale si trova in src/app.py e può essere eseguita con il comando:

uv run python src/app.py

Albero delle cartelle:

upo-appAI/
├── Dockerfile
├── LICENSE
├── README.md
├── docker-compose.yaml
├── docs/
├── pyproject.toml
├── requirements.txt
├── src/
│   ├── __pycache__/
│   ├── app/
│   │   ├── __init__.py
│   │   ├── __pycache__/
│   │   ├── agents/
│   │   │   ├── __init__.py
│   │   │   ├── __pycache__/
│   │   │   ├── market_agent.py
│   │   │   ├── news_agent.py
│   │   │   ├── predictor_agent.py
│   │   │   └── social_agent.py
│   │   └── tool.py
│   ├── app.py
│   ├── example.py
│   └── ollama_demo.py
└── uv.lock

Problemi noti

Google ci sono differenze fra i modelli 1.x e i modelli 2.x. Si suggerisce la costruzione di due metodi differenti. 2. gemini-1.5-flash funziona perfettamente 3. gemini-2.5-flash non funziona passando parametri come temperature e max_tokens, bisogna trovare la nuova sintassi.
Ollama viene correttamente triggerato dalla selezione da interfaccia web ma la generazione della risposta non viene parsificata correttamente.

ToDo

Per lo scraping online bisogna iscriversi e recuperare le chiavi API 2. Market Agent: CoinGecko 3. News Agent: CryptoPanic 4. Social Agent: post più hot da r/CryptoCurrency (Reddit)
Capire come gpt-oss parsifica la risposta e per questioni "estetiche" si può pensare di visualizzare lo stream dei token. Vedere il sorgente src/ollama_demo.py per risolvere il problema.