Aller au contenu

Créer un fichier PDF avec Talend (tFileOutputPDF2)

Tutoriel complet et illustré pour intégrer le composant tFileOutputPDF2 dans Talend Open Studio ou Talaxie, et générer automatiquement un rapport PDF à partir de vos données.

← Retour au blog

Dans beaucoup de projets Talend, on se retrouve tôt ou tard avec le même besoin :
sortir un rapport PDF lisible à partir d’un flux de données.

Sauf que… Talend Open Studio (et même Talaxie) ne propose aucun composant natif pour ça.
La bonne nouvelle ? Il existe une solution simple et efficace, encore trop méconnue : tFileOutputPDF2, un composant communautaire archivé sur GitHub.

Ce guide explique comment :

  1. Installer le composant,
  2. Le configurer dans Talend,
  3. Construire un job complet qui génère un PDF prêt à partager.

💡 Astuce — Compatibilité Talaxie
Ce composant fonctionne parfaitement sous Talaxie, le fork open source de Talend.
Si vous migrez ou prévoyez de le faire, consultez :
Migrer Talend vers Talaxie →


1. Préparer l’environnement

Avant de commencer, assurez-vous d’avoir :

Télécharger le composant

Le composant est disponible ici :
👉 tFileOutputPDF2.zip

💡 Astuce — Github Talend Exchange
Retrouvez bon nombres de composant sur les archives github TalendExchange

Décompressez le contenu dans un dossier, par exemple :
C:\Studios\Talend\Composants_additionnels

Extraction de l'archive du composant tFileOutputPDF2

Vérifiez que le dossier contient bien tous les fichiers nécessaires :

Contenu du dossier du composant tFileOutputPDF2


2. Activer le composant dans Talend

Dans Talend, ouvrez :
Fenêtre → Préférences → Talend → Composants

Renseignez ensuite le chemin du dossier :
C:\Studios\Talend\Composants_additionnels

Configuration du dossier des composants utilisateur dans Talend

💡 Astuce
Si le composant n’apparaît pas dans la palette, redémarrez Talend : il sera automatiquement détecté au prochain lancement.


3. Créer le job d’exemple

Le plus simple est de partir d’un jeu de données simulé pour valider le fonctionnement du composant.

Générer des données avec tRowGenerator

Ajoutez un tRowGenerator et définissez le schéma suivant :

Colonne Type Expression
id Integer Numeric.sequence("id_seq", 1, 1)
nom String TalendDataGenerator.getLastName()
prenom String TalendDataGenerator.getFirstName()
ddn Date TalendDate.getRandomDate("1980-01-01","2025-10-15")
nbre_article_achete Integer Numeric.random(0,100)
prix_article_unitaire Integer Numeric.random(1,200)

Générez une vingtaine de lignes pour tester.

Configuration du composant tRowGenerator pour générer des données de test


4. Enrichir le flux avec tMap

Ajoutez un tMap entre le générateur et le futur composant PDF.
Créez deux nouvelles colonnes calculées :

Colonne Type Expression
utilisateur_enregistre Boolean row1.nbre_article_achete % 2 == 0 ? true : false
total_panier Integer row1.nbre_article_achete * row1.prix_article_unitaire

Cette étape rend le jeu de données plus proche d’un cas métier réel.

tMap enrichissant les données avant export PDF


5. Ajouter le composant PDF

Dans la palette Talend, cherchez tFileOutputPDF2 dans la catégorie
Fichier → Écriture, puis reliez-le à la sortie du tMap.

Palette Talend affichant le composant tFileOutputPDF2

Le composant est maintenant prêt à être configuré.


6. Configurer le rendu du PDF

Paramètres simples

Dans les Paramètres simples, on gère la structure du document :

Cochez la case Aspect sur chaque section (Titre, Sous-titre, etc.) pour débloquer les options de style.

Exemple de configuration basique du tFileOutputPDF2


Paramètres avancés

Les Paramètres avancés contrôlent le corps du tableau :

Configuration avancée du composant tFileOutputPDF2

💡 Astuce
Pour un rendu professionnel : police sobre (Arial, Calibri, Roboto), titres gras, logo léger et fond clair.
Un PDF lisible vaut mieux qu’un PDF “démonstratif”.


7. Visualiser le résultat

Lancez votre job : Talend génère un PDF complet comprenant :

Exemple de fichier PDF généré par Talend avec tFileOutputPDF2

Ce type de rapport peut être utilisé dans des contextes variés : reporting interne, exports client, suivi qualité, etc.


8. Télécharger le projet complet

L’ensemble du job présenté dans ce tutoriel est disponible sur GitHub :

Projet d’exemple tFileOutputPDF2 sur GitHub
(Job Talend complet, composants, expressions, et fichiers.)


Conclusion

Le composant tFileOutputPDF2 est une pépite méconnue.
En quelques minutes, il transforme un flux Talend en rapport PDF clair et professionnel, sans passer par Excel ou un outil tiers.

Cette approche ouvre la voie à des exports automatiques, des rapports quotidiens ou des synthèses clients intégrées à vos pipelines ETL.

💡 Astuce
Combinez tFileInputDelimited → tMap → tFileOutputPDF2 pour créer un flux “lecture / transformation / rendu PDF” complet et automatisable.


Ressources