Hasznosságok dél(előtt)re

Csak címszavakban, Lifehackerről.

Keresés kombinálása Google-ból, Wikipédiáról és YouTube-ról, aztán a találatok közti billentyűs navigáció. Ezt hívják keyboardr.com-nak.

Windows alá hasznos a FoxGLove, ami egy komplett Firefox-csomag, alaposan személyre szabva és krómosítva.

Egy gyönyőrűen megszerelt Windows-asztal, jó ez a sorozat.

Végül pedig egy viccnek is rossz levél a Katalisten.

Ja, persze, csináltam ilyet.

Könyvkeresés, egészség, csillagos ég

Több mint egy éves kimaradás után újra postaládámban landolt a Google könyvtáros hírlevél. Ez alatt az egy év alatt sok minden történt Google és könyvtár viszonylatában, ezt még az is észrevehette, aki eddig a homok alá dugott fejjel élte kis világát. Ennek megfelelően dugig van a hírlevél újdonságokkal, természetesen első helyen szerepel a Google Book Search, de felvonul a két újdonság, a Google Sky és Health is, emellett pedig szemezgetést lehet olvasni az Inside Google Search Blog legjobb bejegyzéseiből, amelyek az elmúlt fél év során születtek.

Google datacenter

Elsőként, a Google könyvkeresőjének fejlesztői azt szeretnék tudatosítani, hogy a rendszer messze többre képes azon kívül, hogy a könyveket online elérhetővé teszi. Természetesen ez az alap, de ezen túllépve fontosnak tartják, hogy a felhasználó az őt érdeklő adathoz, információhoz juthasson hozzá minél hatékonyabban.

Ennek érdekében a könyvkereső még jobban integrálódott a Goolge webkeresőjébe. Azt talán már sokan észrevették, hogy bizonyos kereséseket futtatva a Google könyvekeresője által feldolgozott adatokba botlik, nos ezt jelenti az integráció, és azért tartják fontosnak a cégnél, mert így egyszerre több típusú információ tud összekapcsolódni, így (a jövőből kiragadott példával) Szabó Magda könyvek mellett az írónővel foglalkozó blogokat, műveiből készült filmeket is találhatunk. Egyelőre azonban ez csak az angol nyelvű domainek alól érhető el, a többin szokás szerint szépen lassan, fokozatosan vezetik be.

Elindult egy lap olvashatatlanságának jelentése szolgáltatás is, aminek segítségével a hibásan, rosszul szkennelt dokumentumlapokat lehet jelezni a működtetőknek.

A fejlesztők számára volt jó hír az API megnyitása (erről hírt adtunk mi is, ahogy az ezt követő jogi malőrről is), amivel a könyv egyedi adatai alapján (ISBN, OCLC szám  vagy LCCN) ad hozzáférést a dokumentumok adataihoz. Ez persze nem csak a műkedvelőknek lehet hasznos, hanem a könyvtáraknak is, akik ennek segítségével plusz adatokat tudnak megjeleníteni a katalógusukban (borító, kiegészítő adatok). Sőt, ki is terjesztheti a katalógusunkat, hiszen ennek segítségével az állományban nem szereplő könyveket is tudunk keresni benne, így az olvasó meggyőződhet arról, hogy valóban arra a dokumentumra van-e szüksége, a számára szükséges információk szerepelnek-e benne, és hogy ha igen, akkor melyik könyvtárban vagy milyen más módon férhet hozzá. (És így épül Bábel tornya a közös világkatalógus.)

A hozzáférés jogszerűségét segíti az, hogy a Google könyvkeresőn keresztül hozzáférhetővé váltak a U.S. Copyright Office Record-ok, így könnyen megállapítható, hogy egy letölteni kívánt könyvet véd-e szerzői jog, avagy sem. (Egy könyvről elég nehezen állapítható meg az USA-ban a kiadási idő és hely alapján, hogy védi-e még a jog, csak a fent említett hivatal szerzői jogi frissítési feljegyzései segíthetnek, na ezekhez lehet most már hozzáférni többé-kevésbé jól, ráadásul le is lehet őket tölteni egy XML-fájlban.)

A Google Sky csapata a letölthető Google Earth alkalmazással érkező kiegészítést, illetve a Google Moon és Mars térképeket mutatta be. A Sky már 100 millió csillagot ismer, 200 millió galaxisban, olyan forrásokból szerezve a képeket hozzá, mint a Hubble űrtávcső. A csillagászat és földrajz órákat segítheti az Earth & Sky oldalon található kiegészítő ismertető információk (még podcastek is tölthetőek le). KML fájlokkal egészíthetjük ki a Sky tudását, amik többek közt egy csillag felrobbanását bemutató animációt is tartalmaznak. A webes verzió március óta érhető el.

A Google Health az egészségügyi információkat kívánja gyűjteni és rendszerezetten elérhetővé tenni. Az inspirációt az adta, hogy az emberek eddig is a keresőt használták, ha valamilyen betegégre, egészségügyi információra voltak kíváncsiak. Ezek után már ezeket az információikat is rendezetten tudják tárolni, így jobban át tudják látni a betegségek, fertőzések stb. miértjeit és hogyanjait. Ezzel együtt pedig kombatibilissé válnak az adatok, így létre tud jönni egy világméretű egészségügyi információs rendszer.

Csak én érzek ki némi parás felhangot ebből az utolsó mondatból?

A páciensek rendszerbe tudják gyűjteni információikat magukról és az őket érdeklő betegségekről, ezeket meg tudják osztani azokkal, akikben bíznak. Az egészségügyi információk megoszthatók biztosítók, magánpraxisok, kórházak, rendelők közt, az új orvosunk vagy csak a mentő, ami egy baleset után elvisz minket, kapásból át tudja látni az eddigi kórképünket (ha ezt így mondják).

Lehetőségünk van a rendszerben online egészségügyi profil létrehozására, gyógyszerinformációk letöltésére orvosoktól és gyógyszertáraktól, hasznos információforrások gyűjtésére és megosztására, online eszközöket és szolgáltatásokat vehetünk igénybe, valamint orvost és kórházat kereshetünk.

Végül pedig a szemezgetés az Inside Google Search Blog legjobbjaiból:

  • Februártól a My Library (saját hír) tartalmát meg lehet másokkal is osztani. Ráadásul, ha egy könyvről leírást adunk, akkor annak esélye van megjelenni a könyv találati oldalán az “About this book” részben. Természetesen a közösségiesség jegyében lehetőségünk van mások leírásait is elolvasni, azokat elmenteni kedvencként. A teljes bejegyzés angolul »
  • Decemberben egy csomó iGoogle gadgetet adtak ki a Google könyvekeresőjéhez, ezek a Nap könyve, Könyvkereső, Szabadalomkereső és a Scholar. A teljes bejegyzés angolul és a gadgetek »
  • Novemberben Yana Ivey, a Google Book Search Support Team tagja osztotta meg, hogyan lehet utazást tervezni a Google könyvekeresőjével. Német- és oroszországi útjához itt talált útikalauzt és a helyi kultúráról szóló hasznos olvasmányokat. A teljes bejegyzés angolul »
  • A University of Virginia könyvtárában kiállítás segítségével tanították meg a hallgatóknak és tanárainknak a Google könyvkeresőjének használatát. A teljes cikk angolul » (Ó, és pont Faulkner kiállítás van, messze van a fenébe is…)
  • Az iskolaidő kezdetekor Agnes Eymery (Google Book Search Support Team) azt mutatta be, hogy hogyan tudja segíteni a Goole könyvkeresője az iskolásokat és szüleiket a tanávre való felkészülésben. A teljes cikk angolul »

És két ráadás:

  • Márciusban ismét megrendezték a Google 4 Doodle logótervező versenyt. (Nem hiszem, hogy ez túl mélyen érintene minket, mindenesetre megvan a május 22-i fura logó forrása.)
  • Legvégül kis érdekesség: Dr. Joshua Schwimmer lelkendezett a Youtube-on, hogy milyen jól jött neki a Google könyvkeresője orvosi téren is. Hasonló felhasználói élményeket természetesen bárki beküldhet a Google-nak írásban vagy videón.

A bejegyzéshez a képet az Vladstudio-tól vettem. Kattra nagyobb, egyik kedvenc háttérképem, mint az a fejlécben is lehet látni kis alakok nélkül.

Image by Vladstudio.com

A Google és a láthatatlan web

Eddig nagy mellénye volt a könyvtáros öntudatnak, amikor a Google-ról volt szó (tudom, nekem is, nem tagadom). Az indok az volt ugye, hogy na de a láthatatlan web, meg hogy ahhoz már ember kell, a tökösebbik fajtából (azaz aki ismeri és szerzett logint az adott adatbázishoz, és még használni is tudja).

A Google viszont megtette az első lépést: elkezdte indexelni a web láthatatlan részét is. Ez a gyakorlatban annyit tesz, hogy ahol lát egy olyan FORM-ot, amely GET kérést küld, azt megpróbálja kitölteni, és a kapott eredményt indexeli.

Magyarán pl. az összes OPAC (már ha persze eljut odáig a Google robotja) szépen le lesz indexelve, és egyszerűen egy okos Google keresőkérdéssel az összes megadott OPAC-ban tudok keresni, anélkül, hogy ellátogatnék a könyvtár oldalára, illetve OPAC-jába közvetlenül.

Úgyhogy újabb lehetőségről csúsztunk le, pont akkor amikor elkezdtük végre mérni a webes látogatószámot, sőt nem egy helyen külön az OPAC-ét is. Ez a fent vázolt Google akció azt fogja jelenteni, hogy a látogatók újabb drasztikus visszaesése várható, most a weben (ez az én fogalmazásomban azt jelenti, hogy a kedves olvasót/felhasználót stb. az égvilágon semmi nem fogja csábítani, hogy használja az OPAC-ot, csak ha havonta egyszer meg akarja hosszabbítani a könyvét – nincs semmi pluszszolgáltatása a rendszernek). Persze ettől nem fog kevesebb ember járni könyvtárba, de most megint elhalásztak előlünk egy eléggé kézenfekvő, de mégis nagyszerű alkalmat.

Én viszont személy szerint örülök neki. Eddig is a legtöbbször valamilyen Google-eszközt használtam, ezután ennyivel lesz egyszerűbb a dolgom. Arról nem is beszélve, hogy a Zotero végre működni fog a magyar állománnyal is, ugyanis hogyha egyszer már behúzta és indexelte a Google az állományt, akkor a keresési eredményből egyszerűen át tudom magamnak pakolni. És nem, nem az OPAC-ból, hanem a Google keresési eredményeiből.

Ráadásként pedig jöjjön egy 119 elemes lista, hogy mi szerepel biztosan az adatbázisban már – az Online Education Databes blogról.

Fotó kredit: Said the Spider to the Fly by Thomas Hawk

Update: mint Andris megsúgta, nagyrészt hülyeséget írtam, mert a Google csak az oldalakon szereplő kifejezéseket próbálja berakni a formba, azt is csak módjával teszteli, hogy el ne “hízzon”, ergo a könyvtári OPAC-okat nem indexeli, hiszen semmiféle állományinformáció nincs azok környéken (könyvlisták: legújabbak, legnépszerűbbek, szerzők, címek, ilyesmik). Ettől függetlenül azért igazam is volt valamennyire.

Adatbányászat újratöltve

Ma újra eszembe jutott, hogy hát engem érdekel az adatbányászat, és hogy volt egy cikk, amit le is fordítottam a nyár végén. Amíg újabb nem jön, addig ezt is átszedem a régi blogomról (külön Gábornak, csak hogy ne kelljen annyit keresni ; )

A UCI adatbányászai felzárkóztak a Google mögé (Colin Stewart)

To Google or not to Google – ez már nem valódi kérdés többé. Természetesen használni kell a Google-t, különben az Internet jó része kikerül a látótérből. A legkedveltebb internetes kereső bármit segít megtalálni: Birkenstock Arizona szandált, tv-műsort vagy akár azt, hogy hogyan hasznosítják újra a hulladékot.

De mi van akkor, ha nem vagyunk biztosak benne, hogy pontosan mit is keresünk?

Ebben az esetben legjobb a UC Irvine-nál dolgozó David Newman-hoz és kollégáihoz fordulni, akik egy olyan programot segítettek kifejleszteni, amely anélkül tud keresni nagy mennyiségű szöveget, hogy megmondanák neki, mit keressen.

A szövegbányászatnak ez a formája egy statisztikai topic-modellezés nevezetű eljárást használ, amelynek távolra mutató hatásai valószínűsíthetőek az internetes keresésben. Ez a technikát használhatják akár piackutatók, akik a kulturális trendeket akarják tanulmányozni, történészek, akik a modern társadalom gyökereit térképezik fel, doktorok, akik az orvosi kutatások hegynyi publikációjával szembesülnek vagy akár titkosügynökök, az e-mail-forgalom analizálásához, hogy kiszűrjék a terroristákat.

A topic-modellezés az adatokat kategorizálja, a szavak egymást való követésének gyakoriságának mérésével. Ezek a kategorizált eredmények böngészése a felhasználó számára olyasmik, mintha egy könyvesboltban keresgélne, ahelyett hogy egy adott könyvet vásárolna meg online.

“Nagyon egyszerű a használata, a szövegbányászat evolúciós ugrást végzett” állítja Newman. “Pár éven belül mindenki által használt, hétköznapi eszköz lesz, orvostól kezdve hirdetőkig, íróktól a politikusokig.”

A topic-modellezést, amelyet számítógépes szakemeberek és kutató egyetemek fejlesztettek ki, még nem alkalmazzák az adatkereséssel foglalkozó cégek. De Newman szerint pár éven belül a szakmai körökön kívül is fogják használni.

“Amikor az emberek először hallanak erről, azt gondolják: ‘Ó, persze. Google.’” mondja professzor Sharon Block, a UCI-nél dolgozó történész, aki szintén Newman programját használta kutatásaihoz. “Valójában egy 10.000$-os piramis-játék.”

A piramis játékban, amely 1973-ban indult, hírességek adtak meg szavakat a játékosoknak, akik megpróbálták meghatározni, hogy milyen közös kategória alapján lehet ezeket a szavakat összekötni.

Még dolgozunk azon, hogy a számítógép képes legyen egy jelentéssel bíró címkét rakni az egyes kategóriákra, mondja Newman. A topic-modellezést nem csak különböző területeken, de különböző módokon is lehet használni – trendek kiszűrésére, ismeretlen adatok rendezésére vagy észrevétlen kapcsolatok feltérképezésére.

Trendek kiszűrése: hirdetők, piackutatók és kiadók tanulhatnak a foci, a biciklizés, az Oszkár-díjak és a társaságok negyedévi jelentései iránti érdeklődés növekedésének-esésének mintázatából, amint ez nyilvánvalóvá vált Newman legutóbbi kutatása alapján. Topic-modellezést használt 330.000 sajtóhír (legtöbbjük a New York Times-ból származott) elemzéséhez. A program kategorizálta a leggyakoribb szavakat, neveket, helyeket és szervezeteket.

A Times 2000-től 2002-ig terjedő számait vizsgálva, a különböző témakörökben használt szavak számának elemzése a következő eredményt hozta:

  • A foci népszerűsége nőtt, ezt a szavak havi 25.000-ről havi 40.000-re való növekedése bizonyította.
  • A Tour de France iránti érdeklődés csökkent ebben az időszakban, ezt a szavak számának 14.000-ről 12.000-re való csökkenése jelezte.
  • Az Oszkár-díjakkal foglalkozó cikkek hossza majdnem duplázódott 2001-ről (Gladiátor) 2002-re (Egy csodálatos elme).
  • A vállalatok negyedéves jelentései iránt 2001-ben volt a legmagasabb az érdeklődés, amikor a dot-com lufi kidurrant.

Newman felesége, Block történész-professzor asszony ezt a topic-modellezést alkalmazta a Pennsylvania Gazette-ben 1728-tól 1800-ig (ebbe az időbe esik az az időszak is, amikor Benjamin Franklin volt a lap tulajdonosa) megjelent 82.000 cikken és hirdetésen a trendek szűréséhez.

Az eredmények között feltűnt neki, hogy ha a divatról és a kereskedelemről szóló cikkek száma nőtt, akkor a vallásról szólók csökkentek – és vice versa. Az 1750-es években volt a “ruha” kategória csúcspontja, amely többek között a “gyapjúszövet”, a “selyem”, a “vászon”, “finom” és “fonál” szavakat tartalmazza, ugyanakkor a mélypontja az olyan cikkeknek, amelyekben pl. az “egyház”, az “erény” és “jellem” szavak szerepeltek.

Ismeretlen adatok rendezése:
Kutatók a topic-modellezést használták annak a 250.000 e-mailnek az elemzéséhez, amelyet a U.S. Igazségügyi Minisztériumnak küldtek.

Newman szerint ez segítheti a Google Library Project-et is, amely digitális formátumba konvertálja azt a sok millió könyvet, amely a Standford, Harvard és Oxford egyetemeken, a New York Public Library-ban és sok más helyen van.

A nemzetbiztonsági ügynökségek szintén jól tudnák hasznosítani a topic-modellezést a hatalmas mennyiségű rendezetlen adat feldolgozásában. Ez magyarázza, hogy Newman miért mutatta be találmányát a May’s Intelligence and Security Informatics konferenciáján, San Diego-ban.

Új kapcsolatok vadászata: a UCI számítógépes szakemberei olyan tanulmányok felkutatásában fognak segíteni a UCI orvostudományi kutatóinak, amelyek skizofréniához kapcsolódnak.

Topic-modellezést fognak alkalmazni 17 millió orvostudományi folyóiratnak a kutatásához, hogy kiszűrjék azokat a cikkeket, amelyek azokhoz génekhez és agyterületekhez kapcsolódnak, amelyek érintve vannak a skizofréniában.

A modell működése miatt azt is elvárják tőle, hogy ne csak azokat a tanulmányokat találja meg, amelyek közvetlenül kapcsolódnak a skizofréniához – és még nem is említettük a rendezetlenséget.

Eredeti cikk: ‘Data miners’ at UCI moving beyond Google

Guglizd a könyvtáradat

A Hennepin County Library-ban fejlesztették ki a Google Desktop egyik keresődobozát (az olvasók kérésére!), ami közvetlenül a könyvtár katalógusában keres. Így aki alapvetően erről a felületről dolgozik a számítógépén, még egyszerűbben férhet hozzá az állományhoz. Nagyon tetszik.

[Azért zárójelben megjegyzem, hogy eddig nálam akkor is az OSZK Libribar-ja viszi a pálmát… bár az eléggé böngészőhöz kötött – Firefox, IE -, de ez számomra semmit nem von le az értékéből.]

Forrás: Globolibro

Reklám ingyért

A HVG könyvek sorozatában két érdekes új kötet ragadta meg figyelmemet a reggeli kávé közben. Íme:

keressJohn Battelle: Keress! Hogyan alakítja át kultúránkat, üzleti életünket a Google és az internetes keresés

“A Wired alapító szerkesztőjének könyve egy, az életünket megváltoztató technológiáról: a keresőkről. Mit jelent mindennapjainkban az állandóan rendelkezésre álló, végtelen információmennyiség? Milyen hatással lehetnek a keresők életstílusunkra? Milyen kulturális következtetéseket lehet levonni a keresőmotorokba naponta tízezerszámra beírt keresésekből? A téma természetesen nem kerülheti meg az évtized legkiemelkedőbb cégtörténetét: Battelle élvezetesen meséli el a Google alapítását, mutatja be alapítóinak egymást kiegészítő, yin-yang személyiségét és a cégkultúrát, amit létrehoztablogvilagk.”

A másikról nem találtam képet (de Kelt meg igen, csak én tompa vagyok, nagyon), pedig az is HVG-KFKI kiadvány, a címe pedig blogvilág (Egy műfaj születése), szerzette (ahh) Bőgel György et al. (azaz és a többiek, kevésbé könyvtárosok kedvéért).

“Ez a könyv – a HVG Könyvek kötete a blogról – nem blogkönyv vagy bloggerkönyv, hanem több hozzáértő ember közös gondolkodása egy nagyon friss tartalom- és hírközvetítő műfajról, amelynek információtechnikai vonatkozásain túl kihatásai vannak a gazdasági életre és személyes infokultúránkra egyaránt. Ezeket a hatásokat – bár a műfaj még nagyon fiatal – máris érdemes elemezni: ezt teszik a könyvünk első részét kitevő tanulmányok. A kötet második részeként közölt blogrészlet, Bőgel György IT-lábjegyzetének kivonata jól illusztrálja a forrásban levő, sokszoros irányultságú blogműfajt – s közben érdekes olvasmányanyagot is nyújt az információgazdaság újszerű témáiban.”

Ez most ilyen update-elt cikk, és egyszer el is szállt. Sux.

EBSCO a Google-ban itthon is

Magyarországról is elérhető szeptembertől a Google szolgáltatása, amellyel a keresést az EBSCO cikkadatbázisában is el lehet végezni. A keresési eredményben a “Fulltext from EBSCO.” Az opció azonban csak az EBSCO-nál regisztrált könyvtárak IP-caméről működik – alapesetben. Azonban ha a nyitólapon a Scolar preferences oldalon országnak a Hungary-t adjuk meg, könyvtárnak (Find library) pedig az OSZK-t [Hungary – National Szechenyi Library (EBSCOhost) (Fulltext from EBSCO)], és mindezt elmentjük, máris kereshetünk a fulltext cikk-adatbázisban. Nosza hát!

És: a hivatkozásokat akár BibTEX, RefMan, RefWorks, WenXianWang (na ilyet ki használ itthon, erre kíváncsi vagyok) vagy akár EndNote formátumban is lehet kérni…

Forrás: Könyvtári Intézet – A magyarországi EBSCO használat legfrissebb hírei