Jag började med Bloggpuls förra söndagen som mitt SEO Sunday-projekt. Det tog lite längre att få klart än jag trodde, men efter några kvällars jobb börjar bitarna falla på plats.
Varför?
Bloggarna jag prenumererar på handlar i stort sett bara om webbutveckling och politik. Det kan ju bli lite torrt ibland och därför använder jag ofta nyligen för att slumpvis dyka ner någonstans i bloggosfären och börja läsa. Jag tycker det är helt fantastiskt att så många vågar dela med sig av sina framgångar, motgångar, åsikter och känslor. Jag önskar bara att jag hade mer tid att läsa fler personliga bloggar.
Tanken med bloggpuls är att lista korta utdrag ur bloggposter på ett sätt som väcker lusten att läsa mer genom att fokusera på den känslomässiga aspekten i bloggosfären.
Hur?
Bloggpuls är uppenbarligen inspirerat av Twistori – men istället för att samla inlägg från twitter så visar bloggpuls upp inlägg från den svenska bloggosfären.
Själva inläggen kommer från Google Blog Search. Nya inlägg hämtas en gång i minuten för att mellanlagras i en databas. Vid varje sidvisning hämtas de 100 senaste inläggen som visas en och en med tre sekunders mellanrum.
För att få tag på bloggposter har jag har provat ganska många olika sökverktyg utan att hitta hågon som passar perfekt:
- Twingly – Ger för korta utdrag i RSS flödet och ofta förekommer inte sökorden i utdraget.
- Bloggsök – har inget rss-flöde för resultatet.
- Knuff – Verkar inte hantera flera sökord och ger inga utdrag i rss-flödet.
- Frisim – Ger bara första meningen i RSS flödet och ofta förekommer inte sökorden i utdraget.
- Technorati – Ger för få svenska resultat.
- Google Blog Search – Fungerade bäst och ger lagom långa utdrag. Däremot indexeras hela sidor – inte bara bloggposter. Bloggar som använder nyckelorden på varje sida i till exempel en presentation kommer därför matcha varje gång de skriver ett inlägg oavsätt vad de skriver om. Lösningen på detta var att spara en hash-summa för texten i databasen. Nya inläggs hash-summa jämförs sedan med summorna som redan finns (hash-kolumnen görs unik och INSERT IGNORE används för att lägga till nya poster).
Innan visning kortas utdragen ner till hela meningar som innehåller nyckelordet.
Framöver kommer jag lägga till några undersidor med andra typer av nyckelord och titta lite på om det går att göra alternativa sätt att presentera innehållet.