Lire un fichier dans un zip
JoJoS
Membre
Bonjour à tous !!
J'ai fouillé un peu sur le site mais rien trouvé pour mon problème.
Alors voilà :
Mon but est de récupérer sur internet un fichier zip et de lire le contenu d'un fichier présent à l'intérieur.
Pour corser les choses, je ne veux pas enregistrer de fichier sur le disque dur, donc tout doit se faire en mémoire.
J'ai déjà réussi à faire ça en java, mais la je ne trouve rien pour ouvrir une archive en Cocoa, ni même en C d'ailleurs...
Si quelqu'un à son idée, voir même solution sur le problème !! Ca serait super génial !!
Merci !!
J'ai fouillé un peu sur le site mais rien trouvé pour mon problème.
Alors voilà :
Mon but est de récupérer sur internet un fichier zip et de lire le contenu d'un fichier présent à l'intérieur.
Pour corser les choses, je ne veux pas enregistrer de fichier sur le disque dur, donc tout doit se faire en mémoire.
J'ai déjà réussi à faire ça en java, mais la je ne trouve rien pour ouvrir une archive en Cocoa, ni même en C d'ailleurs...
Si quelqu'un à son idée, voir même solution sur le problème !! Ca serait super génial !!
Merci !!
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
En revanche, je ne sais pas si mon fichier sera décodé si il est plutôt de type "application/zip"...
Je teste ça ce soir !
Par contre, mon fichier sera obligatoirement enregistrer sur le disque...
Bref, ca règle pas vraiment mon problème, mais ça me laisse une porte de sortie si je n'arrive pas à faire ce que je souhaitais au départ.
Quand je dis "assez bas niveau" je veux dire "y'a sans doute rien de si spécifique dans les API de Cocoa" et je pense donc du coup que tu devrais te tourner du côté des API C.
Je pense bien sûr en particulier à "libzip", librairie qui est fournie/installée avec OSX donc que tu dois avoir en standard, et qui devrait te fournir tout ce dont tu as besoin ; j'ai pas regardé la page man de libzip ceci dit mais bon à mon avis c'est de ce côté qu'il faut creuser.
Pourquoi ne veux-tu pas enregistrer le fichier sur le disque (quitte à l'enregistrer en fichier temporaire qui pourra se détruire après dès que tu n'en n'as plus besoin) ? les répertoires genre /tmp et les commandes genre tmpfile sont faite pour ça, non ? Et ce serait plus simple à mon avis (car tu as plus d'outils pour manipuler des fichiers ZIP que des données ZIp en mémoire), mais bon.
Je voulais que ce soit en mémoire pour faire une application transportable facilement. Quelle puisse être exécutée à partir d'une clé usb par exemple.
Mais ce n'est pas bien grave, je vais d'abord essayer de le faire en passant par un fichier sur le dur, puis je verrais bien si je m'en sors avec la libzip. En tout cas, à première vue, elle à l'air de bien correspondre à ce que je recherche !
Merci AliGator !!!
Y a plein de moyen de récupérer le contenu d'une URL en mémoire... Ex, pour NSURLConnection :
Ca va récupérer le contenu de la requête dans un objet NSData
C'est pour cela que je postais : comment décompresser une archive zip en mémoire ?
NSURLDownload me permettrait apparemment de télécharger l'archive, puis de la décompresser mais sur le dur.
C'est bête quand même...
Sinon, hier j'ai essayé d'utiliser NSURLDownload dans un projet Fundation, mais je n'arrive pas à télécharger.
En fait, ça arrive trop vite au return.
Je suppose donc que NSURLDownload télécharge dans un processus à part et de ce faite, mon appli n'attend pas que celui ci soit fini.
J'ai donc fait une boucle while en testant la fin du téléchargement, mais ça reste bloqué (boucle infinie à jamais !).
Bref, ce soir je test mais dans une application graphique, je pense que ça fonctionnera mieux.
Je referai le test ce soir si j'ai le temps.
Mais je me dis qu'avec un peut de chance, c'est la méthode qu'utilise Safari pour extraire automatiquement les fichiers zip après leur téléchargement.
Je verrai bien et je vous tiendrai informé !
Mais gzip ne permet pas de décompresser des fichiers zip ? Parce que du coup je suis plus pessimiste...
Bref, je verrai bien ca quand j'aurai fait tourner mon appli de test.
Tu devrais en effet prendre en considération la remarque de schlum...
(Pour les définitions et différences entre "archivage" et "compression", voir la fin du post)
- gzip est le nom d'un système de compression de données (ça utilise l'algo "deflate" en fait, qui est un combiné de LZW et d'un codage Huffman). Ca prend un flux binaire en entrée, et ça le compresse en sortie.
C'est donc un algo qui agit sur un flux de données (par exemple du texte, le code source d'une page HTML par exemple, puisque c'est un algo pultôt adapté à ce genre de cas). Ou alors qui agit sur un fichier unique (en appliquant l'algo sur le contenu dudit fichier, tout bêtement).
--> Tu ne peux pas archiver plusieurs fichiers dans un seul fichier ".gz" (format gzip), puisque c'est un format de compression d'un flux unique de données : ça ne gère pas l'aspect archivage, c'est à dire le groupement de plusieurs fichiers en un seul avec une sorte de catalogue/liste des noms originaux des fichiers et leur position dans le fichier archive etc.
(C'est pour ça qu'on voit parfois circuler des fichiers ".tar.gz", qui n'est autre qu'un fichier ".tar" qui a été gzippé, le format TAR étant, lui, un format d'archivage (sans compression) permettant donc de grouper plusieurs fichiers en un avant d'appliquer le gzippage)
- ZIP est un format d'archivage et de compression : il compresse chaque fichier à mettre dans l'archive à l'aide de l'algo "deflate" (LZW+Huffman, le même que celui utilisé par gzip), et ensuite il archive les données gzippées dans un fichier unique, le munissant d'un header par fichier (indiquant comment a été compressé le fichier, sa checksum, etc) ainsi que d'un "central directory", sorte de table des matières listant les fichiers dans l'archive.
La grande différence entre les 2 formats est donc que ZIP est une archive (groupement de plusieurs fichiers en un seul) en plus de compresser (via l'algo "deflate" en général, bien qu'en fait il supporte d'autres algos comme BWT ou autre) les données qu'elle archive. gzip n'est que le nom d'une compression de données (algo deflate), sans gestion de l'aspect "archivage".
---
Si les classes NSURLDownload & co savent gérer le gzip (donc la décompression de données compressées par l'algo deflate), c'est typiquement pour pouvoir décoder un flux binaire reçu par le réseau (par HTTP par exemple), car certains serveurs web envoient par exemple le code source (de leurs pages HTML) compressé avec l'algo deflate/gzip. C'est bien là le cas d'un flux de données unique. Et pas d'un fichier et encore moins d'une archive ZIP archivant plusieurs fichiers
--> La gestion du format ZIP est donc bien plus vaste que la simple gestion de l'algo deflate (et donc de la compression gzip) puisqu'elle inclut la gestion du format d'archive ZIP, qui utilise gzip mais contient bien plus de choses aussi.
Safari utilise l'utilitaire de OSX "BOMArchiveHelper" (qui, lui, utilise la librairie libzip ou les outils utilitaires zip/unzip j'imagine) pour décompresser les archives qu'il a téléchargées. Il utilise ce logiciel sur les fichiers une fois ces derniers téléchargés, et ne les décompresse pas à la volée en mémoire, évidemment, lui...
Côté bibliothèques, zlib c'est pour gérer le format gzip (deflate), libzip c'est pour gérer des fichiers au format ZIP (originellement PKZIP)
Définitions
Archive : groupement de plusieurs fichiers en un seul (avec indexation des divers fichiers archivés, avec leur nom, pour pouvoir effectuer un désarchivage et donc retrouver les fichiers d'origine, ça va de soi). les images disques peuvent être considérées comme un format d'archivage à la limite. Le format tar est un bon exemple de format ne faisant que de l'archivage de plusieurs fichiers en un seul, sans pour autant compresser ces données.
Compression : réduction (dans la mesure du possible) de la taille d'un flux de données ou d'un fichier, en utilisant des algos statistiques par exemple (probabilité de répétition de données, etc). Il existe de la compression avec perte (on enlève des données jugées peu importantes, quitte à perdre en qualité) comme celle qu'on trouve dans le JPEG ou le MP3 par exemple, et la compression sans perte, que l'on trouve dans les formats de compression de fichier, telles que les compressions LZW, deflate, BWT (utilisé par bzip2)... permettant une fois le fichier décompresser de retrouver l'original intact.
J'avais déjà compris cette différence entre compression et archive en faisant mes recherches, mais je ne savais pas à quoi servait gzip.
Ca ne sera pas aussi magique que ce que j'espérai... :-\\
Il va donc falloir que je télécharge le zip, que je lance dans un processus la décompression de celui ci, puis que je supprime le zip.
Et éventuellement, que je charge en mémoire le fichier décompressé puis que je le supprime.
Je vais essayer de faire ça ce soir !!
Il va donc me falloir essayer d'utiliser la libzip mais je n'ai pour l'instant rien trouvé dessus pour mac os x...
Bref, je vais fouiller un peu !
Euh... Tu sais, c'est une bibliothèque universelle ; elle tourne sur tous les OS, donc pas la peine de chercher quelque-chose spécifique à Mac OS X ; c'est du C et ça fonctionne partout pareil :P
Je vais retenter pour voir.
Pour la libzip, je testerai après avoir réussi à extraire puis lire mon fichier.
Et puis c'est sur, c'est un bon exercice que je ferai !!!
En tout cas, merci à vous 2 !!
Je vous tiens au courant !!!
Ca m'apprendra à faire un framework !
Merci !!
Mais il faut pas être trop pressé, pour l'instant je me bats pour faire fonctionner unzip en NSTask...
Bonjour,
Comment faire apres telechargement du fichier zip pour le dezipper avec une barre de progress????
Merci