Modérateur: Modos
NRT421 a écrit:Pour les pdf récalcitrants, qqun a-t-il essayé Tabula ?
paulotrail a écrit:NRT421 a écrit:Pour les pdf récalcitrants, qqun a-t-il essayé Tabula ?
Bonjour,
J'ai pas encore essayé sur un pdf bien pourri mais sur mon NuNux, c'est du java et ça rame de chez rame....
- obligation de lancer le jar en tache de fond
- lancer un navigateur, parcourir le pdf et analyser son contenu
- exporter en pdf
Je trouve que c'est vraiment trop laborieux.
Par contre, cela provient peut-être de mon micro...
Cela dit, je te remercie pour ton post car je suis encore à la recherche de l'outil parfait pour extraire ces p.... de pdf.
NRT421 a écrit:Désolé que ce Tabula ne s'avère pas très prometteur.
Codant très occasionnellement (et médiocrement) sur des sujets qui n'ont rien à voir avec la digestion de pdf de classement, j'avais noté votre souci et essaye de voir ce qui peut traîner sur le sujet qd je traîne sur des forums. J'avais relevé pour Python PyPDF2, pdfminer et pdftohtml/pdftable mais n'ai pas posté sur le sujet car j'imagine que ce sont de grands classiques. Par contre ce Tabula m'a semblé pour l'instant moins commenté mais plutôt commenté positivement. Raison pour laquelle je l'ai signalé.
jano a écrit:salut, j'ai des résultats à envoyer (pilatrail 42km) mais je ne vois plus trop sur la fiche de la course comment les soumettre car il y a déjà le lien externe qui a été ajouté.
il y avait bien un bouton"soumettre des résultats" sur la fiche de la course avant ?
miniping a écrit:(mais enlevez lui les droits éditeurs )
_lg_ a écrit:
Sous linux tu as des commandes qui convertissent plus ou moins bien les PDF en TXT. Je n'utilise rien de ce genre sous Mac OS X.
_lg_ a écrit:Que fait-on lorsqu'une partie des coureurs est basculée sur un parcours de repli ? C'est le cas du 65 km (et 3400 m D+) du trail des Passerelles du Monteynard 2016 (résultats). Les derniers font 58 km (et 2900 m D+) et leurs temps sont donc meilleurs qu'une partie des coureurs mieux classés.
_lg_ a écrit:J'ai écrit un script en R qui d'un copier-coller depuis un PDF de http://www.l-chrono.com (exemple) fabrique un CSV qui va presque bien.
Mon problème est que je n'arrive pas à automatiser le changement d'encodage d'UTF-8 vers ISO-8859-1. La commande iconv de Mac OS X "cannot convert" ou alors il faut utiliser -t ISO-8859-1//TRANSLIT mais on perd les accents. Du coup, je fais la conversion dans LibreOffice puis recherche sous vim le caractère "?" pour le remplacer par le ou les caractères (accentués) manquants. Si quelqu'un se sent à l'aise avec la difficulté que je rencontre, qu'il se manifeste
#!/bin/bash
if [ $# -lt 1 ]
then
echo '-------------------------------------------------------------'
echo '-- Un parametre attendu (nom de fichier a convertir) !!!!! --'
echo '-------------------------------------------------------------'
exit 1
fi
dir=''
nomfic=${1}
svfic=${1}_av_iconv
cod_in=$(file ${nomfic}|cut -d' ' -f2)
cod_ext='ascii//TRANSLIT'
#
echo "- copie du fichier $(basename ${nomfic}) en $(basename ${svfic})"
cp ${dir}${nomfic} ${dir}${svfic}
#
if [ ${cod_in} = 'ISO-8859' ]
then
code='ISO8859-1'
elif [ ${cod_in} = 'UTF-8' ]
then
code='UTF8'
elif [ ${cod_in} = 'HTML' ]
then
code='UTF8'
elif [ ${cod_in} = 'ASCII' ]
then
echo ' ---> fichier déja codé en Ascii, on ne fait rien !'
exit 1
else
echo ' ---> format de fichier non reconnu !!!! '
exit 66
fi
#
Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 1 invité
Accueil - Haut de page - Aide
- Contact
- Mentions légales
- Version mobile
- 0.01 sec
Kikouroù est un site de course à pied, trail, marathon. Vous trouvez des récits, résultats, photos, vidéos de course, un calendrier, un forum... Bonne visite !