News Problem #38
Reference in New Issue
Block a user
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Problema con le news dato che non prende correttamente tutte le news ma solo un extract breve.
Per qualche ragione Gnews e DuckDuckGoNews non funzionano bene, dato che prendono correttamente il titolo, ma l'intero articolo viene tagliato via o rimane una frase a caso di esso...
Penso abbia a che fare con il fatto che la libreria usata sotto sotto sia newspaper3k che è veramente datata (ultimo commit vero è del 2020).
Propongo quindi di provare a fixare il problema utilizzando la libreria newspaper4k se funziona, altrimenti di trovare altre fonti o fare un qualche tipo di parsing della pagina con bs4.
Per la risoluzione basta andare a prendere l'articolo dentro la funzione
get_latest_newsdelle due API non funzionanti e provare a fare una chiamata all'URL di ogni articolo, parsificando la news con la libreria newspaper4k.Checklist
newspaper4kalle dipendenze dentro pyproject.tomlget_latest_newsdi GoogleNews in modo che aggiorni correttamente la descrizione di ogni articolo.get_latest_newsdi DuckDuckGoNews in modo che aggiorni correttamente la descrizione di ogni articolo.A quanto pare non è un bug in senso stretto. DDGS funziona recuperando uno snippet dai siti web poiché lo scraping totale della pagina non è consentito. Bisognerebbe implementare uno scraper che però a seconda del sito potrebbe essere bloccato e in ogni caso per ogni articolo bisognerebbe fare una richiesta HTTP, quindi se gli articoli finiscono per essere una decina per ciclo potrebbe diventare molto lento.
Poi da quando abbiamo sistemato documentazione e prompt le risposte sono esaustive e documentate nonostante acceda solo a titoli e snipet, oltretutto Gemini ci ha detto che è una cosa che si fa e che funziona bene.
L'unico modo per avere articoli completi è scegliere siti web di nostro gradimento, vedere se hanno API e usarle. Ma questo al massimo diventa un enhancement per un altro issue secondo me. Questo lo possiamo chiudere.
PS: hai una commit che ha delle modifiche per essere aggiornato al main con i nuovi prompt etc. Il promt del team leader è aggiornato per poter usare il tool dei simboli.