Aller directement au contenu
  • 3 Votes
    7 Messages
    302 Vues

    Encore des évolutions. Je ne sais plus à quelle version de BookHub j’en suis ^^
    Le projet est presque reparti de 0, car débugguer des scripts Python qui se lancent à la chaine et une interface web, certes jolies, mais pas si fonctionnelle… J’ai changé de fusil d’épaule. Les outils ont aussi changés :

    • de ChatGPT à Claude pour le dev
    • de Excel à Baserow auto-hébergé pour la wishlist
    • de scripts Python à n8n pour automatiser

    L’idée était aussi d’automatiser encore plus. Plutôt que d’intégrer manuellement les données dans la wishlist (synopsis, ISBN, etc…), j’envoie via Talk (ordi ou smartphone) Titre - Nom auteur, Prénom auteur et tout le reste se fait automatiquement. Après plus de 200 tests, ça tourne assez bien.

    Je laisse tomber pour le moment l’UI, qui est certes jolies, mais moins pratique que Baserow. Je gagne encore un peu de temps avec ce fonctionnement, qui va être améliorer.

    📚 BookHub — Automatisation complète de ma bibliothèque d’ebooks

    Projet perso que je partage : une pipeline qui transforme un simple message en fiche livre complète, entièrement automatisée sur mon NAS.


    Stack technique

    Composant Rôle
    n8n Orchestration de toute la pipeline
    Python / FastAPI Scraper maison pour les métadonnées enrichies
    Ollama + Qwen 2.5 LLM local — génération de synopsis en dernier recours
    Baserow Base de données, source de vérité
    Nextcloud Talk Interface d’entrée (mobile + desktop)
    UnRAID Infrastructure NAS, tous les containers tournent là

    L’idée

    Envoyer un message depuis mon téléphone, et que tout le reste soit automatique.

    Moi (Nextcloud Talk) :  "Perfect enemies - Eilema Decker"
    BookHub :               ✅ Fiche créée — Hillmore University #1 — ISBN 9782017258421
    

    Comment ça marche

    1. Déclenchement

    J’envoie un message dans Nextcloud Talk avec le format Titre - Auteur. Un webhook n8n capte le message et lance le pipeline.

    2. Recherche parallèle

    Le pipeline interroge simultanément plusieurs sources : Google Books, OpenLibrary, Wikidata, et un scraper maison. Chacune excelle dans un domaine différent, ce qui permet de croiser les résultats.

    3. Fusion intelligente

    Chaque champ est renseigné depuis la meilleure source disponible :

    Champ Priorité des sources
    Synopsis Scraper > OpenLibrary > Google Books FR > Google Books EN > Ollama
    ISBN Wikidata > Scraper > OpenLibrary > Google Books
    Série Wikidata > Scraper > Google Books > OpenLibrary
    Numéro de tome Wikidata > Scraper > Google Books > OpenLibrary

    Si aucune source ne trouve le synopsis, Ollama prend le relais et en génère un localement.

    4. Enregistrement

    La fiche complète est enregistrée dans Baserow, prête pour le workflow de téléchargement.


    Résultats sur ~200 livres testés

    Champ Taux de réussite
    Synopsis ~90%
    ISBN ~95%
    Série + numéro de tome ~85%

    Workflow n8n

    [image: 1773311505761-capture-d-e-cran-2026-03-12-a-11.30.41-resized.png]