OctoWeb is een IT bedrijf gevestigd in Hengelo dat zich heeft
gespecialiseerd in het maken van geavanceerde, slimme zoekmachines voor
websites. Deze zoekmachine is gebasseerd op open source technologie en is
een ideale oplossing voor organisaties die wel geavanceerde zoektechnologie willen gebruiken
zonder hoge investeringen of andere lasten.
Advies zoekinterface en inrichting zoekmachine
- Analyse van de beschikbare gegevens en transformatie naar informatie die door de zoekmachine kan worden gebruikt.
- Gewichten toekenen aan meta-data en meenemen in ranking zoekresultaten
- Termen voor autosuggestie verzamelen
- Content "opschonen" door menu's, bread crumbs en andere relevantieverlagende vervuiling te filteren.
Onderhoud en beheer
Rapportage
- Recente zoekopdrachten
- Rapportage aantal zoekopdrachten per maand
- Top 20 zoekopdrachten en zoektermen
- Aantal zoekopdrachten per uur
- Top 20 zoekopdrachten zonder resultaat
- Analyse gebruikte filters (facets)
- Analyse zoekopdracht en bezochte pagina (te gebruiken voor linksuggestie of boost document)
- Exporteren overzichten in Adobe PDF format
- Maandelijks overzicht per e-mail
Features geavanceerde zoekmachine
- Geavanceerde ranking
- Geen gesponsorde links of reclame
- Spellingcorrectie gebaseerd op de geïndexeerde content (niet op algemene woordenboeken)
- Autosuggestie van zoektermen die in de content voorkomen
- taalherkenning en taalspecifieke stemming
- Sortering op elk gewenst veld mogelijk
- Zoeken op synoniemen van woorden (bv. vervuiling ? verontreiniging)
- Zoekt op woorden met accenten en diacrieten
- Zoeken op vervoegingen en verkleinwoorden (subsidie ? subsidies ? subsidietje)
- Zoekresultaten worden naar onderwerp gecategoriseerd (bv. productgroepen)
- Hierarchische categorisering (decision tree)
- Zoeken op metadata die in database is opgeslagen (datum, kleur, prijs, etc.)
- Highlighting (markering) van gebruikte zoektermen in het zoekresultaat
- Query-elevation (bepaalde documenten voorkeurspositie geven, bv. promoties en acties)
- Verwijdert documenten met zelfde content
- Ondersteunt verschillende formats: plain text, HTML, XML, ZIP, OpenDocument, Microsoft Office (Word, Excel, Powerpoint), Adobe PDF,JavaScrip, RSS, RTF, MP3 (ID3 tags)
- Regelmatig updaten van content