Suchmaschinen. Abfragesprachen Und Erweiterte Funktionen

Total Page:16

File Type:pdf, Size:1020Kb

Suchmaschinen. Abfragesprachen Und Erweiterte Funktionen Abfragesprachen und erweiterte Funktionen von WWW-Suchmaschinen* Dirk Lewandowski Universität Düsseldorf Informationswissenschaft [email protected] Zusammenfassung gerecht werden, die letztlich ja auch in Konkurrenz zu den Der vorliegende Artikel stellt die erweiterten Suchmög- Alltagsnutzern stehen, die von sich behaupten, „in Google lichkeiten in den wichtigsten Suchmaschinen vor. Dabei alles finden zu können.“ handelt es sich um Google, Alta Vista, Hotbot (Inktomi), In diesem Aufsatz sollen die Kommandos und Einschrän- Teoma und Fireball. Die Qualität von Suchmaschinen wird kungsmöglichkeiten der wichtigsten Suchmaschinen erläu- in der Regel durch Retrievaltests verglichen. Vor dem tert und auf ihre Besonderheiten hingewiesen werden. Hintergrund professioneller Ansprüche an die Recherche- Dabei werden nur die Möglichkeiten der Recherche nach fähigkeiten der Suchmaschinen müssen aber zusätzlich Texten behandelt; auf die Suche nach Multimedia-Inhalten auch deren Abfragemöglichkeiten betrachtet werden. Nur wird nicht eingegangen. ausgereifte Abfragesprachen erlauben komplexe Suchan- fragen, wie sie im professionellen Umfeld gestellt werden. Retrievaltests Üblicherweise werden Suchmaschinen durch Retrieval- Abstract tests miteinander verglichen (vgl. u.a. Gries- This article presents the extended search possibilities in baum/Rittberger/Bekavac 2002, Veritest 2003). Dabei the most important search engines. It concerns Google, werden die gleichen Suchanfragen an unterschiedliche Alta Vista, Hotbot (Inktomi), Teoma and Fireball. The Suchmaschinen gestellt und die zurückgegebenen Ergeb- quality of search engines is usually compared by retrieval nisse verglichen. In der Regel werden dazu die jeweiligen tests. Against the background of professional demands on Top-Platzierungen der einzelnen Suchmaschinen ausge- the abilities of search engines however their query lan- wertet (in der Regel die ersten zehn oder 20 Treffer). guages must be regarded additionally. Only perfected Bei den Retrievaltests können allerdings nur relativ unprä- query languages permit complex retrieval as placed in a zise Suchanfragen gestellt werden, da sich die Suchspra- professional shere. chen der einzelnen Suchmaschinen zu weit voneinander unterscheiden, um die Ergebnisse präziser Anfragen ver- gleichbar zu machen. Auch für den Nutzer ausgesprochen hilfreiche Methoden, um die Suchanfrage nach dem ersten Ansehen der Trefferliste weiter einzuschränken, können Einleitung bei Retrievaltests nicht berücksichtigt werden. Es ist also Als beliebte und weit verbreitete Angebote werden Such- festzustellen, dass Retrievaltests den Möglichkeiten ein- maschinen vor allem von den „gewöhnlichen Nutzern“ des zelner Suchmaschinen nicht gerecht werden können. Internet benutzt. Bisher vorliegende Untersuchungen Vielmehr müssen die Tests sich mit relativ einfachen haben gezeigt, dass diese nicht dazu bereit sind, sich mit Suchanfragen begnügen. Ihre Ergebnisse sind daher eher Operatoren und erweiterten Suchformularen auseinander für die Anfragen der gewöhnlichen Nutzer aussagekräftig; zu setzen (ausführlich in Sil- dass eine Suchmaschine einfache Anfragen in hoher Quali- verstein/Henzinger/Marais/Moricz 1998). Die Suchma- tät beantworten kann, macht sie jedoch noch nicht zur schinen haben darauf reagiert, indem erweiterte Suchfor- ersten Wahl des Information Professionals. mularen nicht mehr oder nur noch eingeschränkt weiter- Insbesondere die Suchmaschine Google erfreut sich größ- entwickelt werden. Während die „klassische“ Suchma- ter Beliebtheit und belegt in (vor allem populärwissen- schine Alta Vista sich bei ihrem Start im Jahr 1995 noch an schaftlichen) Retrievaltests in der Regel den ersten Platz. den Möglichkeiten professioneller Retrievalsysteme aus Offensichtlich gelingt es dieser Suchmaschine, einfache dem Bereich der Hosts orientierte, stellen neuere Suchma- Suchanfragen mit hoher Präzision zu beantworten. Oder – schinen oft nur wenige Kommandos zur Verfügung. um der Anlage der Retrievaltest gerecht zu werden – es Dies lenkt auf die Frage hin, in wie weit heutige Suchma- gelingt ihr, irrelevante Dokumente aus der Top-10 bzw. schinen den Anforderungen der Information Professionals Top-20 herauszuhalten. In den vorliegenden Retrievaltests sind allerdings die aktuellen Entwicklungen hin zu einem * erscheint in: IWP Information Wissenschaft und Praxis, 55(2004) 1 massiven Spamming des Google-Index noch nicht berück- sichtigt. (Karaunikat 2003) For this operation Try this on Google Interessanterweise ist es allerdings gerade die Suchma- schine Google, die wenig Wert auf präzise Abfragemög- x AND y x y lichkeiten durch die Suchsprache oder erweiterte Such- x OR y x OR y formulare legt. Auch bei anderen Suchmaschinen lässt sich x AND (y OR z) x y OR z feststellen, dass die Abfragesprachen oft zu wünschen übrig lassen. Als Argument wird seitens der Suchmaschi- (x AND y) OR (z AND q) not yet possible nen-Betreiber angeführt, dass diese erweiterten Funktionen (x OR y) AND (z OR q) x OR y z OR q nur selten genutzt würden. Allerdings gibt es keine Erhe- x AND (y OR z OR q) x y OR z OR q bungen zu der Frage, ob diese nicht etwa von einer kleinen Gruppe von Nutzern intensiv genutzt werden. x AND (y OR z) AND q x y OR z q Tabelle 1: Search Engine Showdown Analysis: Boolean Searching on Google (Notess 2000) Untersuchte Suchmaschinen Für diese Untersuchung wurden die Suchmaschinen Google, All The Web, Alta Vista, Hotbot (Inktomi), Teoma Proximity-Operatoren und Fireball ausgewählt. Hierbei handelt es sich um die Die Suche mit dem Abstandsoperator NEAR ist bei Alta Suchmaschinen mit den weltweit größten Indizes (vgl. Vista und Fireball möglich. Der voreingestellte Wortab- Sullivan 2003) bzw. im Fall von Fireball um die führende stand beträgt dabei maximal zehn Wörter. Mit dem deutsche Suchmaschine mit eigenem Index. Portalangebo- WITHIN-Operator bei Alta Vista lässt sich der maximale te wie Yahoo oder T-Online wurden nicht berücksichtigt, Wortabstand auch selbst bestimmen. Die Syntax lautet da diese ihre Suchergebnisse in nahezu allen Fällen von hier: {Suchbegriff 1} within {Wert} {Suchbegriff 2}. einer der genannten Suchmaschinen beziehen. (vgl. Clay Dabei ist auf das Leerzeichen zwischen within und dem 2002; für den deutschen Markt vgl. Suchfibel 2003) Wert zu achten. Hotbot wurde ausgewählt, da diese Suchmaschine (bzw. Die anderen untersuchten Suchmaschinen unterstützen Suchoberfläche) den komplexesten Zugriff auf den Inkto- keinerlei Abstandsoperatoren, abgesehen von (wenigstens mi-Index erlaubt. Die Firma Inktomi bietet keine eigene manchmal brauchbaren) Hilfsmitteln wie dem Platzhalter Suchmaschine an, sondern lizensiert ihre Technologie an in der Phrasensuche bei Google (siehe „Phrasensuche“). Seitenbetreiber. Dabei können diese natürlich auch über die Komplexität der Abfragemöglichkeiten entscheiden. Phrasensuche In den von allen Suchmaschinen angebotenen erweiterten Alle genannten Suchmaschinen unterstützen die Phrasen- Suchformularen sind in der Regel die gängigsten Ein- suche durch das Setzen von Anführungszeichen. Sowohl schränkungsmöglichkeiten aufgeführt. Um die volle Funk- Google als auch Alta Vista erlauben eine Art Trunkierung tionalität der jeweiligen Suchmaschine nutzen zu können, innerhalb der Phrasensuche: wird ein Platzhalten (in bei- ist es jedoch nötig, die Kommandosprachen zu verwenden. den Fällen: *) gesetzt, so ersetzt dieser genau ein Wort. Im weiteren Text werden die einzelnen Funktionen vorge- Nützlich ist diese Funktion vor allem für Suchanfragen, stellt, eine Übersicht, welche auch die Kommandos in den bei denen entweder ein Wort nicht bekannt ist, gleichzeitig unterschiedlichen Abfragesprachen enthält, gibt die Tabel- nach alter und neuer Rechtschreibung gesucht werden soll le am Ende des Textes. oder aber bewusst Schreibfehler mit in die Anfrage einge- schlossen werden sollen. Es besteht auch die Möglichkeit, den Platzhalter - getrennt Boolesche Operatoren durch Leerzeichen - mehrmals hintereinander zu setzen, Bei allen untersuchten Suchmaschinen werden Mehrwort- wobei jeder Stern für genau ein Wort steht. anfragen automatisch mit AND verknüpft. Die Verknüp- fung von Suchbegriffen mittels des OR-Operators ist durchweg möglich. Synonyme Der NOT-Operator wird in der Regel durch das Minuszei- Allein bei Google besteht die Möglichkeit, eine Suchan- chen vor einem Wort ausgedrückt. Bei All The Web, Alta frage um Synonyme zu erweitern (vgl. Lewandowski Vista, Hotbot und Fireball kann der Operator auch in 2003). Dazu wird dem jeweiligen Suchbegriff das Tilde- Worten eingegeben werden, was insbesondere bei der Zeichen (~) vorangestellt. Die Synonyme werden bei Klammerung innerhalb von Suchargumenten von Bedeu- Google automatisch generiert. Man sollte sich also trotz tung ist. der teilweise nützlichen Ergebnisse nicht allein auf diese Funktion verlassen, sondern sie eher als Anregung für die Eine volle Unterstützung der Booleschen Operatoren, also eigenständige Suche nach weiteren Synonymen betrach- auch die Möglichkeit, komplexe Suchargumente mit Hilfe ten. von Klammersetzung zu bilden, bieten All The Web, Alta Vista, Hotbot und Fireball. Bei Google und Teoma sind komplexe Suchanfragen nur schwer möglich, lassen sich Trunkierung aber teils durch nicht regelkonforme Syntax simulieren Die einzigen Suchmaschinen, die eine Trunkierung anbie- (vgl. Tabelle 1). ten, sind Alta Vista und Fireball. Mit dem Sternchen wer- den beliebig viele Zeichen am Ende des Worts ersetzt. Es 2 müssen allerdings mindestens drei Zeichen vor dem Trun- schen
Recommended publications
  • Internet Pro Za Č Ínající Uživatele
    Gymnázium Františka Živného INFORMAČNÍ CENTRUM 2/2004 INTERNET PRO ZAČ ÍNAJÍCÍ UŽIVATELE DISTANČ NÍ TEXT Bohumín 2004 TOMÁŠ HUDEC OBSAH PŘ EDMĚ TU Úvod........................................................................................................................................... 3 1. Připojme se..................................................................................................................... 4 2. Prohlížíme stránky.......................................................................................................... 6 3. Hledání v kupce sena.................................................................................................... 10 4. Elektronická pošta ....................................................................................................... 16 2 ÚVOD Text je určen široké pedagogické veřejnosti z řad učitelů „ neinformatiků“, kteří chtějí získat základní informace z oblasti Internetu a chtějí pokud možnost studovat sami v čase, který jim vyhovuje a v prostředí, kde se cítí dobře, nemusí se stresovat a mohou pracovat svým tempem.. Text je napsán distanční formou a může být studován jak samostatně, tak v případě otevření příslušného kurzu pod vedením lektora. Text je oproštěn od obecných informací a je směrován k praktické činnosti čtenáře či frekventanta kurzu. Hlubší studium a někdy i odpovědi na otázky předpokládají další studium literatury nebo vyhledávání informací právě z Internetu. Po prostudování textu budete znát: • Co je to Internet a jak se připojit • Jaké jsou základní
    [Show full text]
  • Market Research SD-5 Gathering Information About Commercial Products and Services
    Market Research SD-5 Gathering Information About Commercial Products and Services DEFENSE STANDARDIZATION PROGRA M JANUARY 2008 Contents Foreword 1 The Market Research Other Considerations 32 Background 2 Process 13 Amount of Information Strategic Market Research to Gather 32 What Is Market Research? 2 (Market Surveillance) 14 Procurement Integrity Act 32 Why Do Market Research? 2 Identify the Market or Market Paperwork Reduction Act 33 Segment of Interest 14 When Is Market Research Cost of Market Research 34 Done? 5 Identify Sources of Market Information 16 Who Should Be Involved In Market Research? 7 Collect Relevant Market Other Information Information 17 Technical Specialist 8 Document the Results 18 on Market Research 35 User 9 Logistics Specialist 9 Tactical Market Research Appendix A 36 (Market Investigation) 19 Testing Specialist 9 Types of Information Summarize Strategic Market Available on the Internet Cost Analyst 10 Research 19 Legal Counsel 10 Formulate Requirements 20 Appendix B 39 Contracting Officer 10 Web-Based Information Identify Sources of Sources Information 21 Guiding Principles 11 Collect Product or Service Appendix C 47 Examples of Tactical Start Early 11 Information from Sources 22 Collect Information from Information Define and Document Product or Service Users 26 Requirements 11 Evaluate the Data 27 Refine as You Proceed 12 Document the Results 30 Tailor the Investigation 12 Repeat as Necessary 12 Communicate 12 Involve Users 12 Foreword The Department of Defense (DoD) relies extensively on the commercial market for the products and services it needs, whether those products and services are purely commercial, modified for DoD use from commercial products and services, or designed specifically for DoD.
    [Show full text]
  • Internet and Information About Nuclear Sciences
    SK00K0107 INTERNET AND INFORMATION ABOUT NUCLEAR SCIENCES. THE WORLD WIDE WEB VIRTUAL LIBRARY: NUCLEAR SCIENCES Jozef KURUC Department of Nuclear Chemistry, Faculty of Natural Sciences, Comenius University, Mlynska dolina CH-1, SK-842 15 Bratislava, Slovak Republic, E-mail: [email protected] Similarly as in other areas, as well as in chemistry, INTERNET has brought revolutionary changes in searching, processing of information and in.the teaching of chemistry [1], The powerful instrument in searching of information in INTERNET are different browsers of the web-pages (www.altavista.com, www.yahoo.com, search.excite.com, www.webcrawier.com, www.iycos.com, infoseeek.go.com, www.hotbot.com, www.zoznam.sk, www.kompas.sk www.seznam.cz and other) [2], but they usually give over-much number of web-pages. Sometimes is ill and slowly to obtain necessary information from so over- much number searched and offered web-pages. By searching in the INTERNET assists the advanced searching, but sometimes it does not conduce to searched information. For assistance by the solving of these problems and for speeding-up of the work serve specialised servers, which give grouped information from certain scientific area and first and foremost links for next relative relevant web-links and web-pages, which are in the area of chemistry, for example, Yahoo- Chemistry-Server [3], list of Mendeleev periodic tables of elements [4], from which each provides certain supplementary information about properties of individual elements, isotopes, occasionally radionuclides. Some of them provide more detail information about radioisotopes [5-7], in nuclear physics it is, for example, Nuclear Info WWW Server [8}.
    [Show full text]
  • How to Choose a Search Engine Or Directory
    How to Choose a Search Engine or Directory Fields & File Types If you want to search for... Choose... Audio/Music AllTheWeb | AltaVista | Dogpile | Fazzle | FindSounds.com | Lycos Music Downloads | Lycos Multimedia Search | Singingfish Date last modified AllTheWeb Advanced Search | AltaVista Advanced Web Search | Exalead Advanced Search | Google Advanced Search | HotBot Advanced Search | Teoma Advanced Search | Yahoo Advanced Web Search Domain/Site/URL AllTheWeb Advanced Search | AltaVista Advanced Web Search | AOL Advanced Search | Google Advanced Search | Lycos Advanced Search | MSN Search Search Builder | SearchEdu.com | Teoma Advanced Search | Yahoo Advanced Web Search File Format AllTheWeb Advanced Web Search | AltaVista Advanced Web Search | AOL Advanced Search | Exalead Advanced Search | Yahoo Advanced Web Search Geographic location Exalead Advanced Search | HotBot Advanced Search | Lycos Advanced Search | MSN Search Search Builder | Teoma Advanced Search | Yahoo Advanced Web Search Images AllTheWeb | AltaVista | The Amazing Picture Machine | Ditto | Dogpile | Fazzle | Google Image Search | IceRocket | Ixquick | Mamma | Picsearch Language AllTheWeb Advanced Web Search | AOL Advanced Search | Exalead Advanced Search | Google Language Tools | HotBot Advanced Search | iBoogie Advanced Web Search | Lycos Advanced Search | MSN Search Search Builder | Teoma Advanced Search | Yahoo Advanced Web Search Multimedia & video All TheWeb | AltaVista | Dogpile | Fazzle | IceRocket | Singingfish | Yahoo Video Search Page Title/URL AOL Advanced
    [Show full text]
  • BUEC Buzz Archive (1999-2005)
    BUEC Buzz: Archive (1999-2005) Simon Fraser University Library SFU.CA Burnaby | Surrey | Vancouver SFU Online | A-Z Links | SFU Search Home My Library Help Find Library Search Home › Help › Subject Guides › Business Administration › BUEC Buzz › BUEC BUZZ Issue -= BUEC BUZZ: Information Resources in Business and Economics (#993-1) =- **Announcing the first issue of BUEC BUZZ: Information Resources in Business and Economics.** Details about this newsletter follow, but the summary version is that I have created it as a means of informing the faculty and graduate students in Business and Economics of the many relevant information resources that I use as I help people with their research every day. I will generally send new issues out on a weekly basis, although this schedule may stretch to bi-weekly depending on how much I have to say and how busy I am. No action is required of you. Just delete or archive these messages as you see fit. On the other hand, suggestions about resources to mention for the benefit of your colleagues are always welcome. And now the details: 1. WHY is this newsletter necessary? 2. WHAT will be in this newsletter? 3. WHEN will each issue come out? 4. WHERE can I find old issues of the newsletter? 5. WHO will receive it? 6. SUGGESTIONS? ********************************************************************** **1. WHY is this newsletter necessary? As the Business/Economics Liaison Librarian, my job is to be the "library's face" for the Business Faculty and the Economics Department. That is, I am a personal contact for people in those areas who have a question about a library resource, policy, or procedure.
    [Show full text]
  • 28 Buscadores Libro.Indb
    notes fromebcenter The Converging Search Engine and Advertising Industries Av. Pearson, 21 08034 Barcelona Tel.: 93 253 42 00 Fax: 93 253 43 43 www.ebcenter.org Top Ten Technologies Project The Converging Search Engine and Advertising Industries Authors: Prof. Brian Subirana, Information Systems, IESE Business School David Wright, research Assistant, e-business Center Pwc&IESE Editors: Larisa Tatge and Cristina Puig www.ebcenter.org This dossier is part of the Top Ten Technologies Project. For more information please visit http://www.ebcenter.org/topten You can an also find other projects at http://www.ebcenter.org/proyectos e-business Center PwC&IESE edits a newsletter every fifteen days, available at www.ebcenter.org © 2007. e-business Center PricewaterhouseCoopers & IESE. All rights reserved. notes fromebcenter The Converging Search Engine and Advertising Industries Authors: Prof. Brian Subirana, Information Systems, IESE Business School David Wright, Research assistant, e-business Center Pwc&IESE notes fromebcenter Table of Contents Executive Summary ..5 Introduction ..7 1. Technology Description ..9 1.1. History of Text-Based Search Engines ..9 1.2. Description of Applications ..9 1.3. Substitute Products ..11 2. Description of the Firms ..13 2.1. Search Engines and Their Technology ..14 2.2. Competitive Forces ..17 2.3. Consumer Preferences in Search ..22 2.4. New Search Technologies ..23 2.5. Search-Engine Optimization ..25 3. Affected Sectors ..27 3.1. Advertising ..27 3.2. Search-Engine Advertising ..28 3.3. How Search Advertising Works ..32 3.4. Digital Intermediaries ..38 3.5. Original Equipment Manufacturers (OEMs) ..39 3.6. Software and Applications Providers ..39 3.7.
    [Show full text]
  • Building an Open Source Meta-Search Engine
    Building an Open Source Meta-Search Engine A. Gulli A. Signorini Dipartimento di Informatica, University of Pisa University of Iowa, Computer Science [email protected] [email protected] ABSTRACT In the academic literature, there are many proposals for In this short paper we introduce Helios, a flexible and effi- meta-searching. [9] proposes to work by downloading the cient open source meta-search engine. Helios currently runs individual documents, rather than working with the list of on the top of 18 search engines (in Web, Books, News, and snippets returned by search engines. This approach has ev- Academic publication domains), but additional search en- ident performance problems. [10] reports a survey of tech- gines can be easily plugged in. We also report some perfor- niques that have been proposed to tackle several underlying mance mesured during its development. challenges in building a meta-search engine. [5] discusses methods for improving answer relevance in meta-search en- Categories and Subject Descriptors gines. [11, 12, 6] propose several strategies for combining H.3.3 [Information Storage And Retrieval]: Informa- the ranked results returned from multiple search engines. tion Search and Retrieval Our contribution: In this short paper we introduce Helios, General Terms a complete meta-search engine for retrieving, parsing, merg- Design, Experimentation, Measurement ing, and reporting results provided by many search engines. Our contributions are the followings: Keywords (1) Helios is a full working open-source meta-search engine Meta Search Engines, Open Source available at http://www.cs.uiowa.edu/∼asignori/helios/. Dif- ferent research groups can use the system to interact with 1.
    [Show full text]
  • Zacínáme S Internetern
    - Modul 7 ....................................................................................................................... Zacínáme s internetern Slovointernet slyšel snad každý. Díkyhromadným sdelovacím prostredkum mají mnozí internet za tajemné místo neresti. Už se tolik nemluví o tom, že internet je také velmi užitecným pomocníkem. Pokud používáte nekterou ze služeb internetu, je treba dbát základních pravidel opatrnosti. Alemožnosti, které internet nabízí, bohate tuto opatrnost vyváží. Internet je celosvetová pocítacová sít nazvané ARPANET (Advance Research Pro- ní bázi a snažily se pritom vyhnout síti (nekdy se také ríká "sít sítí"), jinak receno, ject Agency NET). Casem se k této pocíta- NSFNET. vývoj smerem ke komercnímu celosvetová sbírka navzájem propojených cové síti zacala pripojovat další pocítacová využití internetu byl urychlen zákonem pocítacu. Kdykoliv se k ní mohou pripojit centra, predevším vysoké školy a výzkumné High Performance Computing Act, prija- další a další pocítace, menší i vetší pocíta- organizace, se kterými Pentagon spolupraco- tým v roce 1991. Vedlo to k tomu, že sít cové síte. Vše probíhá spontánne a nikde val. NSFNET byla v dubnu roku 1995 od inter- nenajdete žádné stredisko (centrálu), které Nakonec se v roce 1982 odpojila ciste netu zcela odpojena - tím bylo zastaveno by vše rídilo a organizovalo. vojenská cást s názvem MILNET a sít veškeré státní financování internetu ze stra- Internet poskytuje velké množství služeb ARPANET byla prenechána vedeckým ny USA. Tak byl ukoncen proces prechodu od posílání pošty pres prohlížení a vyhledá- a výzkumným pracovištím. Sít pozdeji pre- internetu na komercní základ, pricemž vání informací až po ruzné konference a dis- rostla hranice Spojených státu a stala se základní principy internetu zustávají zacho- kuse na nejruznejší témata. Pritom mužete základem pro propojení škol, univerzit vány.
    [Show full text]
  • Solving the Circular Conundrum: Communication and Coordination in Two-Sided Markets
    Solving the Circular Conundrum: Communication and Coordination in Two-Sided Markets Daniel F. Spulber* Northwestern University October 2009 ________________________________ * Elinor Hobbs Distinguished Professor of International Business and Professor of Management & Strategy, Kellogg School of Management, Northwestern University, 2001 Sheridan Road, Evanston, IL, 60208. Professor of Law (courtesy), Northwestern University School of Law, e-mail: [email protected]. I gratefully acknowledge the support of a grant from Microsoft to the Searle Center on Law, Regulation, and Economic Growth. Prepared for the Conference on Maturing Internet Studies organized by James Speta, Northwestern University Law School. I thank participants of the conference for helpful comments, including Shane Greenstein, Bill Rogerson, and Jim Speta. Outline INTRODUCTION I. CROSS-MARKET BENEFITS A. MARKET THICKNESS EFFECTS B. VARIETY AND SCALE EFFECTS C. NETWORK EFFECTS II. CENTRALIZED COORDINATION BY REDUCING TRANSACTION COSTS A. STRATEGIC PARTICIPATION IN TWO-SIDED MARKETS B. SOLVING THE CIRCULAR CONUNDRUM BY FOSTERING DECENTRALIZED COORDINATION III. CENTRALIZED COORDINATION BY PROVIDING MEDIA CONTENT AND CONSUMER REWARDS A. SOLVING THE CIRCULAR CONUNDRUM THROUGH CONTENT AND CONSUMER REWARDS B. THE CIRCULAR CONUNDRUM WITH COMPETING FIRMS IV. CENTRALIZED COORDINATION BY ACTING AS A MARKET MAKER A. THE CIRCULAR CONUNDRUM WITH MARKET MAKING FIRMS B. MARKET MAKING WITH MANY BUYERS AND MANY SELLERS C. MARKET MAKING WITH VARIETY AND SCALE EFFECTS V. CASE STUDIES
    [Show full text]
  • Comparison of Web Search Engines Using User-Based Metrics in Survey Statistics *Ogunyinka, P
    Futo Journal Series (FUTOJNLS) e-ISSN : 2476-8456 p-ISSN : 2467-8325 Volume-6, Issue-2, pp- 190 - 200 www.futojnls.org Research Paper December 2020 Comparison of web search engines using user-based metrics in survey statistics *Ogunyinka, P. I.1, Aigbogun, L. I.1, Iheanyichukwu, B. F.2, Ekundayo, O. M.3, Banjo, O.1, Olubanwo, O. O.1 and Dehinsilu, O. A.1 1Department of Mathematical Sciences, Olabisi Onabanjo University, Ago-Iwoye, Ogun State, Nigeria. 2Olabisi Onabanjo University Library, Olabisi Onabanjo University, Ago-Iwoye, Ogun State, Nigeria. 3Department of Computer Science, Federal University of Technology, Akure, Ondo State, Nigeria. *Corresponding Author’s Email: [email protected] Abstract Different web search engines had been rated based on different metrics. However, almost none had considered the search query length, the retrieved quantity and retrieval time for evaluation of web search engines. This study had rated five web search engines (Google, Yahoo, WOW, AOL and Bing) using non-parametric Kruskal-Wallis test for significant mean difference and single-phase sampling for regression estimation and examination of internal error. The retrieval time was used as the study variable while the retrieved quantity of the organic search results and the search query length were used as the auxiliary variables. The correlation coefficient, mean square error, percentage coefficient of variation and percentage relative efficiency were used for the evaluation and comparison of the estimated population mean of the retrieval time. Results revealed that Google was the most rated web search engine with the highest significant retrieved quantity and significant retrieval time while Bing was the least rated web search engine.
    [Show full text]
  • Internet Debate Research Rich Edwards, Baylor University 2012
    Internet Debate Research Rich Edwards, Baylor University 2012 Terms Internet Provider: The commercial service used to establish a connection to the Internet. Examples of a service provider are America Online, Sprint, ATT, MSN, Road Runner, etc. Internet Browser: The software used to manipulate information on the Internet. The four major browsers in use are Chrome (the Google product), Mozilla Firefox (the successor to Netscape), Safari (the Apple product) and Internet Explorer (the Microsoft product). Each type of browser will give you access to the same group of search engines, which is the main thing you will care about. Firefox has one feature that other browsers lack: it can report to you the last revision date of a Web page (select “Page Info” from the top “Tools” menu to access this function). I teach debaters that a Web page may be dated from the last revision date if no other date is shown on the page; Internet Explorer, Chrome and Safari offer no way to know this date. URL: This stands for Universal Resource Locator. It is the http://www.baylor.edu etc. Internet Search Engine: The software used to search for information on the Internet. You will use the same group of search engines, regardless of which browser (Explorer, Firefox, Chrome, or Safari) you may be using. Examples of search engines are Google, Bing (formerly Microsoft Live), AllTheWeb, HotBot, Teoma, InfoSeek, Yahoo, Excite, LookSmart, and AltaVista. I have described the strengths and weaknesses of the various search engines in later paragraphs. My personal favorites are Google and Bing for policy debate research and the Yahoo Directory Search for Lincoln Douglas research.
    [Show full text]
  • Web Search Engines), ● Redundancy in Index Storage  Storage of Document Ids
    WebWeb SearchSearch EnginesEngines ➔ Crawler Simple Crawler Large-Scale Crawler Efficient DNS Resolution Robot Exclusion Protocol (Near-)Duplicate Detection ● Indexer ● Query Interface ● Ranker ● Scalability 1 J. Fürnkranz WebWeb searchsearch enginesengines ● Rooted in Information Retrieval (IR) systems Prepare a keyword index for corpus Respond to keyword queries with a ranked list of documents. ● ARCHIE Earliest application of rudimentary IR systems to the Internet Title search across sites serving files over FTP 2 J. Fürnkranz SearchSearch EnginesEngines ● Crawler http://www.searchenginewatch.com collect internet addresses ● Indexer break up text into tokens (words) create inverted index advanced indices include position information and hyperlink information ● Query interface query for words and phrases Boolean expressions search for location, site, url, domain, etc. ● Ranker heuristics based on frequency/location of words heuristics based on hyperlink structure (page rank (Google)) pre-defined categories or clustering of results 3 J. Fürnkranz CrawlingCrawling andand indexingindexing ● Purpose of crawling and indexing quick fetching of large number of Web pages into a local repository indexing based on keywords Ordering responses to maximize user’s chances of the first few responses satisfying his information need. ● Earliest search engine: Lycos (Jan 1994) ● Followed by…. Alta Vista (1995), HotBot and Inktomi, Excite Mining the Web 4 Chakrabarti and Ramakrishnan J. Fürnkranz SimpleSimple CrawlerCrawler // SpiderSpider Source: www.codeproject.com 5 J. Fürnkranz SimpleSimple CrawlerCrawler // SpiderSpider 1. Initialize Queue with a (set of) random starting URL(s) 2. retrieve the first URL in the Queue 3. find all hyperlinks in the retrieved page 4. add new hyperlinks to the Queue (remove duplicates) 5. store retrieved page 6.
    [Show full text]