Jak pobierać dane ze stron www

Przedstawię poniżej jak można automatycznie pobierać opisy z katalogów książek, opisy obiektów ze stron muzeów, archiwów czy też oferty ze sklepów lub portali ogłoszeniowych.

Prezentowane narzędzie tworzy plik wynikowy w popularnym formacie csv dzięki czemu daje możliwość automatycznego pobierania danych ze stron www bez potrzeby angażowania informatyka. Można je zaliczyć do grupy parser stron www online.

Przy małych zastosowaniach (jak dla biblioteki) wystarczy jego bezpłatna funkcjonalność. Bezpłatnie nie znaczy za darmo bo wymaga podpięcia pod konto gooogle czy fejsbuka więc płacimy prywatnością.

import.io bo o nim mowa działa w przeglądarce i automatycznie zbiera strukturyzowane informacje, a następnie pozwala je zachować w różnych formatach. Na potrzeby stworzenia bota do twittera potrzebny będzie format danych csv, ale można dane również pobrać w formatach JSON lub pdf.

Opis jak pobierać dane

Pracę zaczynamy od przygotowania (więcej…)

Nowy Rok nadciąga

Nie będzie podsumowania bieżącego roku bo blogowo nie ma co podsumowywać parafrazując „jaki blog był każdy widzi”.

Napiszę więc trochę o planach na przyszły rok bo mam dość ambitne:

  • Jako że zostałem ABI będę miał sporo ciekawej pracy (i opisywania wynikających z niej przemyśleń zapewne też). Niestety to co mi pozostawiono, to jakaś ukryta kamera lub coś na podobnym poziomie abstrakcji. Przykładowo kontakty w dokumentach ogólnych poprzypisywano do konkretnych osób nie funkcji. Zamiast adresu kadry@fabryka..pl mamy adres zuzia.x@fabryka..pl. Jako że pani Zuzia Xsowska nie pracuje od 2 lat to główny dokument trzeba poprawiać (i wszystkie inne też). Hardcore jakieś…
  • Latarniczenie wejdzie w kluczowy okres realizacji zadania. Mam do połowy roku poumawiane spotkania tak aby wykonać bezstresowo plan, a nawet na dłużej co dotyczy kolejnego punktu.
  • Trzecim punktem na przyszły rok to stworzenie internetowej gazety Virtual Journal. W założeniach jest to (więcej…)

Ciekawe adresy dla Starszaków

Jak kiedyś pisałem prowadzę zajęcia wprowadzające w nowe technologie dla Starszaków w ramach działań Latarnika PCRS. Na tej stronie będę budował bazę adresów która zademonstruje ciekawsze/przydatne moim zdaniem strony w…

Jak sprawdzić firmę?

W związku z ostatnim naciąganiem mnie przez telefon pomyślałem że utrwalę na blogu dwa przydatne adresy umożliwiające bezpłatne wyszukiwanie firm. Przydadzą się zarówno Wam jak i mnie gdy będę z…

Prowadzenie katalogu – zasadzka ;)

  • Post category:pomysłystrony www
  • Reading time:2 mins read

Katalog stron bibliotek i bibliolubówJak wiecie prowadzę Katalog Bibliotek On-Line. To taka linkownia która mam nadzieję przyda się zwłaszcza mniejszym bibliotekom które nie mają żadnych linków do siebie. Niby to jeden link ale skoro katalog jest wąskotematyczny przekaże użytkownika i dobrego mocą pozycjonującego linka :)

Sądząc po ilości odwiedzin zamysł ten jakoś powoli zaczyna działać, ludzie pojawiają się w katalogu i idą na strony bibliotek. Ku memu lekkiemu zdziwieniu nawet wystawiają bibliotekom oceny w serwisie.

Pierwszą zasadzką było że faktycznie zaczęli się pojawiać ludzie, a drugą ich talenty w kwestii  (więcej…)