«και πού να τα προλάβεις όλ’ αυτά;», μέρος 1

Προειδοποίηση: Το κείμενο που ακολουθεί επιδιώκει να είναι όσο γίνεται προσιτό σε περισσότερους. Αν όμως, δεν μπορείτε να το παρακολουθήσετε, απλά προσπεράστε το· παρότι δεν έχει ως στόχο την επίδειξη, δεν επιχειρεί και να αρχίσει από το μηδέν.

 
cards-batchΒρήκες, λοιπόν, ένα μπλογκ που δεν φανταζόσουν, στον blogger ή στο wordpress –δεν αναφέρομαι αλλού, με υλικό σπάνιο για μουσικές αγαπημένες, εκτός κυκλοφορίας, πες ας πούμε την ψυχεδελική σκηνή των 60s, και μάλιστα διαβάζεις ότι ο μπλόγκερ δίνει και λινκς για να κατεβάσεις και να ακούσεις δίσκους που δεν υπάρχουν πια. Καθώς διαθέτεις αρκετό bandwidth, και είσαι και συνδρομητής σχετικών υπηρεσιών online αποθήκευσης αρχείων, αποφασίζεις να κατεβάσεις ό,τι προσφέρει το μπλογκ

Έχεις, πλέον, δυο προβλήματα. Ανακάλυψες πολύ αργά το μπλογκ, που έχει ήδη ζωή ετών και εκατοντάδων αναρτήσεων. Ακόμη χειρότερα, τα περιβόητα λινκς είναι στα σχόλια της κάθε ανάρτησης. Τι κάνεις; Η μία λύση είναι το «ξεφύλλισμα» όλου του μπλογκ, όλων των αναρτήσεων και των σχολίων. Σίγουρα, για ένα μπλογκ που ταιριάζει στα γούστα σου θα το κάνεις, εφόσον μπορείς να αφιερώσεις και τον απαιτούμενο χρόνο. Αν όμως αυτό δεν γίνεται; Τι καλά θα ήταν να είχες ένα τρόπο να μαζέψεις όλα τα λινκ για το «κατέβασμα», γρήγορα, ή πιο γρήγορα, εν πάση περιπτώσει από την πρώτη λύση…
 

 
Η εύκολη περίπτωση
Το μπλογκ είναι στον blogger και τα λινκ μέσα στις αναρτήσεις, και όχι στα σχόλια. Πολύ απλά ζητάς να εμφανιστεί «σεντόνι» το σύνολο των αναρτήσεων από καταβολής μπλογκ. Στο βασικό url του μπλογκ πρόσθεσε μετά το τελικό slash «/«, κάτι σαν αυτό search?updated-max=2099-01-01&max-results=20000. Ζητάς, δηλαδή, τις τελευταίες 20.000 αναρτήσεις μέχρι την πρωτοχρονιά του 2099. Ε, μάλλον είσαι ΟΚ. Το ίδιο μπορείς να πετύχεις και με ένα bookmarklet· αν μάλιστα του αντιστοιχίσεις κι ένα keyword, π.χ. τη λέξη all, θα μπορείς να την πληκτρολογείς στο location bar του firefox κάθε φορά που είσαι στην αρχική σελίδα ενός τέτοιου μπλογκ και να έχεις το επιθυμητό αποτέλεσμα. Το περιεχόμενο του bookmarklet πρέπει να είναι:

javascript:location.href=document.location.href+'search?updated-max=2099-01-01&max-results=20000'

Στην εύκολη αυτή περίπτωση, λοιπόν, έχοντας μπροστά σου το «σεντόνι», θα ζητήσεις στον firefox μέσω του extension copy links, να πάρεις στο clipboard όλα τα links από το σεντόνι, και στη συνέχεια θα τα επικολλήσεις σε ένα αρχείο text. Θα χρησιμοποιήσεις μετά έναν text editor, κάπως πιο εξελιγμένο από το notepad… Με ένα μπακάλικο non-geek τρόπο*, θα ζητήσεις ταξινόμηση των γραμμών του αρχείου, ώστε να έρθουν στη σειρά τους όλα μαζί τα λινκ που αφορούν σε υπηρεσίες που λέγαμε στην αρχή, ή σε ενδιάμεσους προς αυτές. Για παράδειγμα αναφέρω το mediafire και το rapidshare για την πρώτη περίπτωση, το lix.in και το sharebee για την δεύτερη.

Κρατάς αυτά που σε ενδιαφέρουν και είσαι έτοιμος για τα περαιτέρω…

Οι δύσκολες περιπτώσεις αφορούν λινκς που είναι στα σχόλια σε μπλογκ του blogger ή της wordpress, ή σε αναρτήσεις σε wordpress, οπότε και δεν (;) υπάρχει τρόπος για το αντίστοιχο σεντόνι.

Η συνέχεια σε επόμενη ανάρτηση, οπότε θα μπει γερά στο παιχνίδι ο σύγχρονος Μεγάλος Αδελφός.

 

  • Εναλλακτικά, ως geek, προσπαθείς να θυμηθείς τα κατάλληλα regular expressions ώστε να κάνεις αναζήτηση και εξαγωγή (δες και την ονομασία αυτού του μπλογκ).
Advertisements

#bookmarklet, #firefox