Item-Based Recommendation Algorithms

Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl

f×aÖÛaÖ¸ kaÖÝÔi׸ kÓÒ×ØaÒ¸ ÖiedÐg@c׺ÙÑÒºedÙ GroupLens Research Group/Army HPC Research Center Department of Computer Science and Engineering

University of , , MN 55455

ÚaiÐabÐe iÒfÓÖÑaØiÓÒ ØÓ ¬Òd ØhaØ Ûhichi×



ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× aÔÔÐÝ kÒÓÛÐedge di×cÓÚeÖÝ ØechÒiÕÙe×

ÇÒe Óf Øhe ÑÓ×Ø ÔÖÓÑi×iÒg ×ÙchØechÒÓÐÓgie× i× cÓÐ ÐabÓÖa¹

ØÓ Øhe ÔÖÓbÐeÑ Óf ÑakiÒg Ô eÖ×ÓÒaÐiÞed ÖecÓÑÑeÒdaØiÓÒ× fÓÖ

ØiÚe ¬ÐØeÖiÒg [½9¸ ¾7¸ ½4¸ ½6]º CÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ÛÓÖk× bÝ

iÒfÓÖÑaØiÓÒ¸ ÔÖÓ dÙcØ× ÓÖ ×eÖÚice× dÙÖiÒg a ÐiÚeiÒØeÖacØiÓÒº

bÙiÐdiÒg a daØaba×e Óf ÔÖefeÖeÒce× fÓÖ iØeÑ× bÝ Ù×eÖ׺ AÒeÛ

Ìhe×e ×Ý×ØeÑ׸ e×Ô eciaÐÐÝ Øhe k¹ÒeaÖe×Ø ÒeighbÓÖ cÓÐÐabÓÖa¹

Ù×eÖ¸ ÆeÓ¸ i× ÑaØched agaiÒ×Ø Øhe daØaba×e ØÓ di×cÓÚeÖ Òeigh¹

ØiÚe ¬ÐØeÖiÒg ba×ed ÓÒe׸ aÖe achieÚiÒg Ûide×ÔÖead ×Ùcce×× ÓÒ

bÓÖ׸ Ûhich aÖe ÓØheÖ Ù×eÖ× ÛhÓ haÚe hi×ØÓÖicaÐÐÝ had ×iÑiÐaÖ

Øhe Ïebº Ìhe ØÖeÑeÒdÓÙ× gÖÓÛØh iÒ Øhe aÑÓÙÒØÓfaÚaiй

Øa×Øe ØÓ ÆeÓº ÁØeÑ× ØhaØ Øhe Òeighb ÓÖ× Ðike aÖe ØheÒ ÖecÓѹ

abÐe iÒfÓÖÑaØiÓÒ aÒd Øhe ÒÙÑb eÖ Óf Úi×iØÓÖ× ØÓ Ïeb ×iØe× iÒ

ÑeÒded ØÓ ÆeÓ¸ a× he ÛiÐÐ ÔÖÓbabÐÝ aÐ×Ó Ðike ØheѺ CÓÐÐab¹

ÖeceÒØÝeaÖ× Ô Ó×e× ×ÓÑe keÝ chaÐÐeÒge× fÓÖ ÖecÓÑÑeÒdeÖ ×Ý×¹

ÓÖaØiÚe ¬ÐØeÖiÒg ha× beeÒ ÚeÖÝ ×Ùcce××fÙÐ iÒ b ÓØh Öe×eaÖch

ØeÑ׺ Ìhe×e aÖe: ÔÖÓ dÙciÒg high ÕÙaÐiØÝ ÖecÓÑÑeÒdaØiÓÒ׸

aÒd ÔÖacØice¸ aÒd iÒ b ÓØh iÒfÓÖÑaØiÓÒ ¬ÐØeÖiÒg aÔÔÐicaØiÓÒ×

Ô eÖfÓÖÑiÒg ÑaÒÝ ÖecÓÑÑeÒdaØiÓÒ× Ô eÖ ×ecÓÒd fÓÖ ÑiÐÐiÓÒ×

aÒd E¹cÓÑÑeÖce aÔÔÐicaØiÓÒ׺ ÀÓÛeÚeÖ¸ ØheÖe ÖeÑaiÒ iѹ

Óf Ù×eÖ× aÒd iØeÑ× aÒd achieÚiÒg high cÓÚeÖage iÒ Øhe face Óf


daØa ×ÔaÖ×iØݺ ÁÒ ØÖadiØiÓÒaÐ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ×Ý×ØeÑ×

chaÐÐeÒge× fÓÖ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ׺

Øhe aÑÓÙÒØÓf ÛÓÖk iÒcÖea×e× ÛiØh Øhe ÒÙÑbeÖ Óf ÔaÖØici¹

Ìhe ¬Ö×Ø chaÐÐeÒge i× ØÓ iÑÔÖÓÚe Øhe ×caÐabiÐiØÝ Óf Øhe cÓй

ÔaÒØ× iÒ Øhe ×Ý×ØeѺ ÆeÛ ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ ØechÒÓÐÓgie×

Ðab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ׺ Ìhe×e aÐgÓÖiØhÑ× aÖe abÐe ØÓ

aÖe Òeeded ØhaØ caÒ ÕÙickÐÝ ÔÖÓ dÙce high ÕÙaÐiØÝ ÖecÓѹ

×eaÖch ØeÒ× Óf ØhÓÙ×aÒd× Óf Ô ÓØeÒØiaÐ Òeighb ÓÖ× iÒ ÖeaйØiÑe¸

ÑeÒdaØiÓÒ׸ eÚeÒ fÓÖ ÚeÖÝ ÐaÖge¹×caÐe ÔÖÓbÐeÑ׺ ÌÓ addÖe××

bÙØ Øhe deÑaÒd× Óf ÑÓ deÖÒ ×Ý×ØeÑ× aÖe ØÓ ×eaÖchØeÒ× Óf

Øhe×e i××Ùe× Ûe haÚe eÜÔÐÓÖed iØeѹba×ed cÓÐÐab ÓÖaØiÚe ¬Ð¹

ÑiÐÐiÓÒ× Óf Ô ÓØeÒØiaÐ Òeighb ÓÖ׺ FÙÖØheÖ¸ eÜi×ØiÒg aÐgÓÖiØhÑ×

ØeÖiÒg ØechÒiÕÙe׺ ÁØeѹba×ed ØechÒiÕÙe× ¬Ö×Ø aÒaÐÝÞe Øhe

haÚe Ô eÖfÓÖÑaÒce ÔÖÓbÐeÑ× ÛiØh iÒdiÚidÙaÐ Ù×eÖ× fÓÖ ÛhÓÑ

Ù×eÖ¹iØeÑ ÑaØÖiÜ ØÓ ideÒØifÝ ÖeÐaØiÓÒ×hiÔ× b eØÛeeÒ di«eÖeÒØ

Øhe ×iØe ha× ÐaÖge aÑÓÙÒØ× Óf iÒfÓÖÑaØiÓÒº FÓÖ iÒ×ØaÒce¸

iØeÑ׸ aÒd ØheÒ Ù×e Øhe×e ÖeÐaØiÓÒ×hiÔ× ØÓ iÒdiÖecØÐÝ cÓÑÔÙØe

if a ×iØe i× Ù×iÒg bÖÓÛ×iÒg ÔaØØeÖÒ× a× iÒdicaØiÓÒ× Óf cÓÒ¹

ÖecÓÑÑeÒdaØiÓÒ× fÓÖ Ù×eÖ׺

ØeÒØ ÔÖefeÖeÒce¸ iØ ÑaÝhaÚe ØhÓÙ×aÒd× Óf daØa Ô ÓiÒØ× fÓÖ iØ×

ÁÒ Øhi× ÔaÔ eÖ Ûe aÒaÐÝÞe di«eÖeÒØ iØeѹba×ed ÖecÓÑÑeÒ¹

ÑÓ×Ø fÖeÕÙeÒØ Úi×iØÓÖ׺ Ìhe×e \ÐÓÒg Ù×eÖ ÖÓÛ×" ×ÐÓÛ dÓÛÒ

daØiÓÒ geÒeÖaØiÓÒ aÐgÓÖiØhÑ׺ ÏeÐÓÓkiÒØÓ di«eÖeÒØØech¹

Øhe ÒÙÑbeÖ Óf Òeighb ÓÖ× ØhaØ caÒ b e ×eaÖched Ô eÖ ×ecÓÒd¸

ÒiÕÙe× fÓÖ cÓÑÔÙØiÒg iØeѹiØeÑ ×iÑiÐaÖiØie× ´eºgº¸ iØeѹiØeÑ

fÙÖØheÖ ÖedÙciÒg ×caÐabiÐiØݺ

cÓÖÖeÐaØiÓÒ Ú׺ cÓ×iÒe ×iÑiÐaÖiØie× b eØÛeeÒ iØeÑ ÚecØÓÖ×µ aÒd

Ìhe ×ecÓÒd chaÐÐeÒge i× ØÓ iÑÔÖÓÚe Øhe ÕÙaÐiØÝ Óf Øhe Öec¹

di«eÖeÒØØechÒiÕÙe× fÓÖ ÓbØaiÒiÒg ÖecÓÑÑeÒdaØiÓÒ× fÖÓÑ ØheÑ

ÓÑÑeÒdaØiÓÒ× fÓÖ Øhe Ù×eÖ׺ Í×eÖ× Òeed ÖecÓÑÑeÒdaØiÓÒ×

´eºgº¸ ÛeighØed ×ÙÑ Ú׺ ÖegÖe××iÓÒ ÑÓ deеº FiÒaÐÐݸ Ûeeܹ

ØheÝ caÒ ØÖÙ×Ø ØÓ heÐÔ ØheÑ ¬Òd iØeÑ× ØheÝ ÛiÐÐ Ðikeº Í×eÖ×

Ô eÖiÑeÒØaÐÐÝ eÚaÐÙaØe ÓÙÖ Öe×ÙÐØ× aÒd cÓÑÔaÖe ØheÑ ØÓ Øhe

ÛiÐÐ "ÚÓØe ÛiØh ØheiÖ feeØ" bÝ ÖefÙ×iÒg ØÓ Ù×e ÖecÓÑÑeÒdeÖ

ba×ic k¹ÒeaÖe×Ø ÒeighbÓÖ aÔÔÖÓachº ÇÙÖ eÜÔ eÖiÑeÒØ× ×Ùg¹

×Ý×ØeÑ× ØhaØ aÖe ÒÓØ cÓÒ×i×ØeÒØÐÝ accÙÖaØe fÓÖ ØheѺ

ge×Ø ØhaØ iØeѹba×ed aÐgÓÖiØhÑ× ÔÖÓÚide dÖaÑaØicaÐÐÝ b eØØeÖ

ÁÒ ×ÓÑe ÛaÝ× Øhe×e ØÛÓchaÐÐeÒge× aÖe iÒ cÓÒ­icظ ×iÒce Øhe

Ô eÖfÓÖÑaÒce ØhaÒ Ù×eÖ¹ba×ed aÐgÓÖiØhÑ׸ ÛhiÐe aØ Øhe ×aÑe

Ðe×× ØiÑe aÒ aÐgÓÖiØhÑ ×Ô eÒd× ×eaÖchiÒg fÓÖ Òeighb ÓÖ׸ Øhe

ØiÑe ÔÖÓÚidiÒg b eØØeÖ ÕÙaÐiØÝ ØhaÒ Øhe b e×Ø aÚaiÐabÐe Ù×eÖ¹

ÑÓÖe ×caÐabÐe iØ ÛiÐÐ b e¸ aÒd Øhe ÛÓÖ×e iØ× ÕÙaÐiØݺ FÓÖ Øhi×

ba×ed aÐgÓÖiØhÑ׺

Öea×ÓÒ¸ iØ i× iÑÔ ÓÖØaÒØ ØÓ ØÖeaØ Øhe ØÛÓ chaÐÐeÒge× ×iÑÙй

ØaÒeÓÙ×ÐÝ ×Ó Øhe ×ÓÐÙØiÓÒ× di×cÓÚeÖed aÖe b ÓØh Ù×efÙÐ aÒd


ÁÒ Øhi× ÔaÔ eÖ¸ Ûe addÖe×× Øhe×e i××Ùe× Óf ÖecÓÑÑeÒdeÖ

Ìhe aÑÓÙÒØ Óf iÒfÓÖÑaØiÓÒ iÒ Øhe ÛÓÖÐd i× iÒcÖea×iÒg faÖ

×Ý×ØeÑ× bÝ aÔÔÐÝiÒg a di«eÖeÒØ aÔÔÖÓachßiØeѹba×ed aÐgÓ¹

ÑÓÖe ÕÙickÐÝ ØhaÒ ÓÙÖ abiÐiØÝ ØÓ ÔÖÓ ce×× iغ AÐÐ Óf Ù× haÚe

ÖiØhѺ Ìhe b ÓØØÐeÒeckiÒcÓÒÚeÒØiÓÒaÐ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖ¹

kÒÓÛÒ Øhe feeÐiÒg Óf b eiÒg ÓÚeÖÛheÐÑed bÝ Øhe ÒÙÑbeÖ Óf

iÒg aÐgÓÖiØhÑ× i× Øhe ×eaÖch fÓÖ Òeighb ÓÖ× aÑÓÒg a ÐaÖge

ÒeÛ b Ó Ók׸ jÓÙÖÒaÐ aÖØicÐe׸ aÒd cÓÒfeÖeÒce ÔÖÓ ceediÒg× cÓѹ

Ù×eÖ Ô ÓÔÙÐaØiÓÒ Óf Ô ÓØeÒØiaÐ Òeighb ÓÖ× [½¾]º ÁØeѹba×ed aй

iÒg ÓÙØ eachÝeaÖº ÌechÒÓÐÓgÝ ha× dÖaÑaØicaÐÐÝ ÖedÙced Øhe

gÓÖiØhÑ× aÚÓid Øhi× b ÓØØÐeÒeckbÝ eÜÔÐÓÖiÒg Øhe ÖeÐaØiÓÒ×hiÔ×

baÖÖieÖ× ØÓ ÔÙbÐi×hiÒg aÒd di×ØÖibÙØiÒg iÒfÓÖÑaØiÓÒº ÆÓÛ

beØÛeeÒ iØeÑ× ¬Ö×ظ ÖaØheÖ ØhaÒ Øhe ÖeÐaØiÓÒ×hiÔ× beØÛeeÒ

iØ i× ØiÑe ØÓ cÖeaØe Øhe ØechÒÓÐÓgie× ØhaØ caÒ heÐÔ Ù× ×ifØ

Ù×eÖ׺ ÊecÓÑÑeÒdaØiÓÒ× fÓÖ Ù×eÖ× aÖe cÓÑÔÙØed bÝ ¬ÒdiÒg

edº Be¹

Copyright is held by the author/owner. iØeÑ× ØhaØ aÖe ×iÑiÐaÖ ØÓ ÓØheÖ iØeÑ× Øhe Ù×eÖ ha× Ðik

ÛeeÒ iØeÑ× aÖe ÖeÐaØiÚeÐÝ ×ØaØic¸ WWW10, May 1-5, 2001, Hong Kong. caÙ×e Øhe ÖeÐaØiÓÒ×hiÔ× b eØ ACM 1-58113-348-0/01/0005.


ÁÒ ÓÒe ×ØÙdÝ Ù×iÒg ×ÝÒØheØic daØa¸ ÀÓÖØiÒg ÔÖÓ dÙced b eØØeÖ Ý b e abÐe ØÓ ÔÖÓÚide Øhe ×aÑe ÕÙaй

iØeѹba×ed aÐgÓÖiØhÑ× Ña

ÔÖedicØiÓÒ× ØhaÒ a ÒeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ [½]º iØÝ a× Øhe Ù×eÖ¹ba×ed aÐgÓÖiØhÑ× ÛiØh Ðe×× ÓÒÐiÒe cÓÑÔÙØa¹

ËchafeÖ eØ aк¸ [¾6] ÔÖe×eÒØ a deØaiÐed ØaÜÓÒÓÑÝ aÒd eÜaѹ ØiÓÒº

ÔÐe× Óf ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ× Ù×ed iÒ E¹cÓÑÑeÖce aÒd hÓÛ Úide ÓÒe¹ØÓ¹ÓÒe Ô eÖ×ÓÒaÐiÞaØiÓÒ aÒd aØ Øhe ×aÑe

1.1 Related Work ØheÝ caÒ ÔÖÓ

caÒ caÔØÙÖe cÙ×ØÓÑeÖ ÐÓÝaÐØݺ AÐØhÓÙgh Øhe×e ×Ý×ØeÑ× haÚe

ÁÒ Øhi× ×ecØiÓÒ Ûe bÖie­Ý ÔÖe×eÒØ ×ÓÑe Óf Øhe Öe×eaÖchÐiع

b eeÒ ×Ùcce××fÙÐ iÒ Øhe Ôa×ظ ØheiÖ Ûide×ÔÖead Ù×e ha× eÜÔ Ó×ed

eÖaØÙÖe ÖeÐaØed ØÓ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg¸ ÖecÓÑÑeÒdeÖ ×Ý×¹

×ÓÑe Óf ØheiÖ ÐiÑiØaØiÓÒ× ×Ùch a× Øhe ÔÖÓbÐeÑ× Óf ×ÔaÖ×iØÝiÒ

ØeÑ׸ daØa ÑiÒiÒg aÒd Ô eÖ×ÓÒaÐiÞaØiÓÒº

Øhe daØa ×eظ ÔÖÓbÐeÑ× a××Ó ciaØed ÛiØh high diÑeÒ×iÓÒaÐiØÝ

ÌaÔ e×ØÖÝ [½¼] i× ÓÒe Óf Øhe eaÖÐie×Ø iÑÔÐeÑeÒØaØiÓÒ× Óf cÓй

aÒd ×Ó ÓÒº ËÔaÖ×iØÝ ÔÖÓbÐeÑ iÒ ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ ha×

Ðab ÓÖaØiÚe ¬ÐØeÖiÒg¹ba×ed ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ׺ Ìhi× ×Ý×¹

b eeÒ addÖe××ed iÒ [¾¿¸ ½½]º Ìhe ÔÖÓbÐeÑ× a××Ó ciaØed ÛiØh

ØeÑ ÖeÐied ÓÒ Øhe eÜÔÐiciØ ÓÔiÒiÓÒ× Óf Ô eÓÔÐe fÖÓÑ a cÐÓ×e¹kÒiØ

high diÑeÒ×iÓÒaÐiØÝ iÒ ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ× haÚebeeÒdi×¹

cÓÑÑÙÒiØݸ×Ùch a× aÒ ÓÆce ÛÓÖkgÖÓÙÔº ÀÓÛeÚeÖ¸ ÖecÓѹ

cÙ××ed iÒ [4]¸ aÒd aÔÔÐicaØiÓÒ Óf diÑeÒ×iÓÒaÐiØÝ ÖedÙcØiÓÒ

ÑeÒdeÖ ×Ý×ØeÑ fÓÖ ÐaÖge cÓÑÑÙÒiØie× caÒÒÓØ deÔ eÒd ÓÒ each

ØechÒiÕÙe× ØÓ addÖe×× Øhe×e i××Ùe× ha× b eeÒ iÒÚe×ØigaØed iÒ

Ô eÖ×ÓÒ kÒÓÛiÒg Øhe ÓØheÖ׺ ÄaØeÖ¸ ×eÚeÖaÐ ÖaØiÒg×¹ba×ed aÙ¹


ØÓÑaØed ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ× ÛeÖe deÚeÐÓÔ edº Ìhe GÖÓÙ¹

ÇÙÖ ÛÓÖk eÜÔÐÓÖe× Øhe eÜØeÒØØÓÛhich iØeѹba×ed ÖecÓѹ

ÔÄeÒ× Öe×eaÖch ×Ý×ØeÑ [½9¸ ½6] ÔÖÓÚide× a Ô×eÙdÓÒÝÑÓÙ×

ÑeÒdeÖ׸ a ÒeÛ cÐa×× Óf ÖecÓÑÑeÒdeÖ aÐgÓÖiØhÑ׸ aÖe abÐe

cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ×ÓÐÙØiÓÒ fÓÖ Í×eÒeØ ÒeÛ× aÒd ÑÓÚie׺

ØÓ ×ÓÐÚe Øhe×e ÔÖÓbÐeÑ׺

ÊiÒgÓ [¾7] aÒd ÎideÓ ÊecÓÑÑeÒdeÖ [½4] aÖe eÑaiÐ aÒd Ûeb¹ Ù×ic aÒd

ba×ed ×Ý×ØeÑ× ØhaØ geÒeÖaØe ÖecÓÑÑeÒdaØiÓÒ× ÓÒ Ñ 1.2 Contributions

ÑÓÚie׸ Öe×Ô ecØiÚeÐݺ A ×Ô eciaÐ i××Ùe Óf CÓÑÑÙÒicaØiÓÒ× Óf

Ìhi× ÔaÔ eÖ ha× ØhÖee ÔÖiÑaÖÝ Öe×eaÖchcÓÒØÖibÙØiÓÒ×:

Øhe ACÅ [¾¼] ÔÖe×eÒØ× a ÒÙÑb eÖ Óf di«eÖeÒØ ÖecÓÑÑeÒdeÖ


½º AÒaÐÝ×i× Óf Øhe iØeѹba×ed ÔÖedicØiÓÒ aÐgÓÖiØhÑ× aÒd

ÇØheÖ ØechÒÓÐÓgie× haÚe aÐ×Ó b eeÒ aÔÔÐied ØÓ ÖecÓÑÑeÒdeÖ

ideÒØi¬caØiÓÒ Óf di«eÖeÒØÛaÝ× ØÓ iÑÔÐeÑeÒØiØ× ×Ùb¹

×Ý×ØeÑ׸ iÒcÐÙdiÒg BaÝe×iaÒ ÒeØÛÓÖk׸ cÐÙ×ØeÖiÒg¸ aÒd ÀÓÖع


iÒgº BaÝe×iaÒ ÒeØÛÓÖk× cÖeaØe a ÑÓ deÐ ba×ed ÓÒ a ØÖaiÒiÒg

¾º FÓÖÑÙÐaØiÓÒ Óf a ÔÖecÓÑÔÙØed ÑÓ deÐ Óf iØeÑ ×iÑiÐaÖiØÝ

×eØ ÛiØh a deci×iÓÒ ØÖee aØ each ÒÓ de aÒd edge× ÖeÔÖe×eÒع

ØÓ iÒcÖea×e Øhe ÓÒÐiÒe ×caÐabiÐiØÝ Óf iØeѹba×ed ÖecÓѹ

iÒg Ù×eÖ iÒfÓÖÑaØiÓÒº Ìhe ÑÓ deÐ caÒ b e bÙiÐØ Ó«¹ÐiÒe ÓÚeÖ a


ÑaØØeÖ Óf hÓÙÖ× ÓÖ daÝ׺ Ìhe Öe×ÙÐØiÒg ÑÓ deÐ i× ÚeÖÝ ×ÑaÐи

ÚeÖÝ fa×ظ aÒd e××eÒØiaÐÐÝ a× accÙÖaØe a× ÒeaÖe×Ø ÒeighbÓÖ

¿º AÒ eÜÔ eÖiÑeÒØaÐ cÓÑÔaÖi×ÓÒ Óf Øhe ÕÙaÐiØÝÓf×eÚeÖaÐ

ÑeØhÓ d× [6]º BaÝe×iaÒ ÒeØÛÓÖk× ÑaÝÔÖÓÚe ÔÖacØicaÐ fÓÖ eÒ¹

di«eÖeÒØ iØeѹba×ed aÐgÓÖiØhÑ× ØÓ Øhe cÐa××ic Ù×eÖ¹ba×ed

ÚiÖÓÒÑeÒØ× iÒ ÛhichkÒÓÛÐedge Óf Ù×eÖ ÔÖefeÖeÒce× chaÒge×

´ÒeaÖe×Ø Òeighb ÓÖµ aÐgÓÖiØhÑ׺

×ÐÓÛÐÝ ÛiØh Öe×Ô ecØ ØÓ Øhe ØiÑe Òeeded ØÓ bÙiÐd Øhe ÑÓ deÐ

ÚiÖÓÒÑeÒØ× iÒ Ûhich Ù×eÖ ÔÖefeÖ¹

bÙØ aÖe ÒÓØ ×ÙiØabÐe fÓÖ eÒ 1.3 Organization

eÒce ÑÓ deÐ× ÑÙ×Ø b e ÙÔ daØed ÖaÔidÐÝ ÓÖ fÖeÕÙeÒØÐݺ

Ìhe Öe×Ø Óf Øhe ÔaÔ eÖ i× ÓÖgaÒiÞed a× fÓÐÐÓÛ׺ Ìhe ÒeÜØ

CÐÙ×ØeÖiÒg ØechÒiÕÙe× ÛÓÖk bÝ ideÒØifÝiÒg gÖÓÙÔ× Óf Ù×eÖ×

×ecØiÓÒ ÔÖÓÚide× a bÖief backgÖÓÙÒd iÒ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖ¹

ÛhÓ aÔÔ eaÖ ØÓ haÚe ×iÑiÐaÖ ÔÖefeÖeÒce׺ ÇÒce Øhe cÐÙ×ØeÖ×

iÒg aÐgÓÖiØhÑ׺ Ïe ¬Ö×Ø fÓÖÑaÐÐÝ de×cÖib e Øhe cÓÐÐab ÓÖaØiÚe

aÖe cÖeaØed¸ ÔÖedicØiÓÒ× fÓÖ aÒ iÒdiÚidÙaÐ caÒ b e Ñade bÝaÚ¹

¬ÐØeÖiÒg ÔÖÓ ce×× aÒd ØheÒ di×cÙ×× iØ× ØÛÓÚaÖiaÒØ× ÑeÑÓÖݹ

eÖagiÒg Øhe ÓÔiÒiÓÒ× Óf Øhe ÓØheÖ Ù×eÖ× iÒ ØhaØ cÐÙ×ØeÖº ËÓÑe

ba×ed aÒd ÑÓ deйba×ed aÔÔÖÓache׺ Ïe ØheÒ ÔÖe×eÒØ ×ÓÑe

cÐÙ×ØeÖiÒg ØechÒiÕÙe× ÖeÔÖe×eÒØ each Ù×eÖ ÛiØh ÔaÖØiaÐ ÔaÖ¹

chaÐÐeÒge× a××Ó ciaØed ÛiØh Øhe ÑeÑÓÖݹba×ed aÔÔÖÓachº ÁÒ

ØiciÔaØiÓÒ iÒ ×eÚeÖaÐ cÐÙ×ØeÖ׺ Ìhe ÔÖedicØiÓÒ i× ØheÒ aÒ aÚeÖ¹

×ecØiÓÒ ¿¸ Ûe ÔÖe×eÒØ Øhe iØeѹba×ed aÔÔÖÓach aÒd de×cÖib e

age acÖÓ×× Øhe cÐÙ×ØeÖ׸ ÛeighØed bÝ degÖee Óf ÔaÖØiciÔaØiÓÒº

di«eÖeÒØ ×Ùb¹Øa×k× Óf Øhe aÐgÓÖiØhÑ iÒ deØaiк ËecØiÓÒ 4 de¹

CÐÙ×ØeÖiÒg ØechÒiÕÙe× Ù×ÙaÐÐÝ ÔÖÓ dÙce Ðe××¹Ô eÖ×ÓÒaÐ ÖecÓѹ

×cÖib e× ÓÙÖ eÜÔ eÖiÑeÒØaÐ ÛÓÖkº ÁØ ÔÖÓÚide× deØaiÐ× Óf ÓÙÖ

ÑeÒdaØiÓÒ× ØhaÒ ÓØheÖ ÑeØhÓ d׸ aÒd iÒ ×ÓÑe ca×e׸ Øhe cÐÙ×¹

daØa ×eØ׸ eÚaÐÙaØiÓÒ ÑeØÖic׸ ÑeØhÓ dÓÐÓgÝ aÒd Öe×ÙÐØ× Óf

ØeÖ× haÚeÛÓÖ×e accÙÖacÝ ØhaÒ ÒeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ×

di«eÖeÒØ eÜÔ eÖiÑeÒØ× aÒd di×cÙ××iÓÒ Óf Øhe Öe×ÙÐØ׺ Ìhe ¬¹

[6]º ÇÒce Øhe cÐÙ×ØeÖiÒg i× cÓÑÔÐeØe¸ hÓÛeÚeÖ¸ Ô eÖfÓÖÑaÒce

ÒaÐ ×ecØiÓÒ ÔÖÓÚide× ×ÓÑe cÓÒcÐÙdiÒg ÖeÑaÖk× aÒd diÖecØiÓÒ×

caÒ b e ÚeÖÝ gÓ Ó d¸ ×iÒce Øhe ×iÞe Óf Øhe gÖÓÙÔ ØhaØ ÑÙ×Ø b e

fÓÖ fÙØÙÖe Öe×eaÖchº

aÒaÐÝÞed i× ÑÙch ×ÑaÐÐeÖº CÐÙ×ØeÖiÒg ØechÒiÕÙe× caÒ aÐ×Ó

b e aÔÔÐied a× a "¬Ö×Ø ×ØeÔ" fÓÖ ×hÖiÒkiÒg Øhe caÒdidaØe ×eØ b ÓÖ aÐgÓÖiØhÑ ÓÖ fÓÖ di×ØÖibÙØiÒg ÒeaÖe×ع


b ÓÖ cÓÑÔÙØaØiÓÒ acÖÓ×× ×eÚeÖaÐ ÖecÓÑÑeÒdeÖ eÒgiÒe׺


ÏhiÐe diÚidiÒg Øhe Ô ÓÔÙÐaØiÓÒ iÒØÓ cÐÙ×ØeÖ× ÑaÝ hÙÖØ Øhe

ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× ×Ý×ØeÑ× aÔÔÐÝ daØa aÒaÐÝ×i× Øech¹

accÙÖacÝ ÓÖ ÖecÓÑÑeÒdaØiÓÒ× ØÓ Ù×eÖ× ÒeaÖ Øhe fÖiÒge× Óf

ÒiÕÙe× ØÓ Øhe ÔÖÓbÐeÑ Óf heÐÔiÒg Ù×eÖ× ¬Òd Øhe iØeÑ× ØheÝ

ØheiÖ a××igÒed cÐÙ×ØeÖ¸ ÔÖe¹cÐÙ×ØeÖiÒg ÑaÝbe a ÛÓÖØhÛhiÐe

ÛÓÙÐd Ðike ØÓ ÔÙÖcha×e aØ E¹CÓÑÑeÖce ×iØe× bÝ ÔÖÓ dÙciÒg

ØÖade¹Ó« b eØÛeeÒ accÙÖacÝ aÒd ØhÖÓÙghÔÙغ

a ÔÖedicØed ÐikeÐiÒe×× ×cÓÖe ÓÖ a Ði×Ø Óf ØÓÔßÆ ÖecÓÑÑeÒded

ÀÓÖØiÒg i× a gÖaÔh¹ba×ed ØechÒiÕÙe iÒ Ûhich ÒÓ de× aÖe iØeÑ× fÓÖ a giÚeÒ Ù×eÖº ÁØeÑ ÖecÓÑÑeÒdaØiÓÒ× caÒ b e Ñade

Ù×eÖ׸ aÒd edge× b eØÛeeÒ ÒÓ de× iÒdicaØe degÖee Óf ×iÑiÐaÖiØÝ Ù×iÒg di«eÖeÒØ ÑeØhÓ d׺ ÊecÓÑÑeÒdaØiÓÒ× caÒ be ba×ed

beØÛeeÒ ØÛÓ Ù×eÖ× [½]º ÈÖedicØiÓÒ× aÖe ÔÖÓ dÙced bÝÛaÐkiÒg ÓÒ deÑÓgÖaÔhic× Óf Øhe Ù×eÖ׸ ÓÚeÖaÐÐ ØÓÔ ×eÐÐiÒg iØeÑ׸ ÓÖ

Øhe gÖaÔh ØÓ ÒeaÖbÝÒÓde× aÒd cÓÑbiÒiÒg Øhe ÓÔiÒiÓÒ× Óf Ôa×Ø bÙÝiÒg habiØ Óf Ù×eÖ× a× a ÔÖedicØÓÖ Óf fÙØÙÖe iØeÑ׺

Øhe ÒeaÖbÝ Ù×eÖ׺ ÀÓÖØiÒg di«eÖ× fÖÓÑ ÒeaÖe×Ø ÒeighbÓÖ a× CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒg ´CFµ [½9¸ ¾7] i× Øhe ÑÓ×Ø ×Ùcce××¹

Øhe gÖaÔh ÑaÝbeÛaÐked ØhÖÓÙgh ÓØheÖ Ù×eÖ× ÛhÓ haÚe ÒÓØ fÙÐ ÖecÓÑÑeÒdaØiÓÒ ØechÒiÕÙe ØÓ daØeº Ìhe ba×ic idea Óf

ÖaØed Øhe iØeÑ iÒ ÕÙe×ØiÓÒ¸ ØhÙ× eÜÔÐÓÖiÒg ØÖaÒ×iØiÚe ÖeÐa¹ CF¹ba×ed aÐgÓÖiØhÑ× i× ØÓ ÔÖÓÚide iØeÑ ÖecÓÑÑeÒdaØiÓÒ×

ØiÓÒ×hiÔ× ØhaØ ÒeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ× dÓ ÒÓØ cÓÒ×ideÖº ÓÖ ÔÖedicØiÓÒ× ba×ed ÓÒ Øhe ÓÔiÒiÓÒ× Óf ÓØheÖ Ðike¹ÑiÒded


ÓÒ ÓØheÖ iØeÑ׺ Ìhe ÑÓ deÐ bÙiÐdiÒg ÔÖÓ ce×× i× Ô eÖfÓÖÑed Ìhe ÓÔiÒiÓÒ× Óf Ù×eÖ× caÒ b e ÓbØaiÒed eÜÔÐiciØÐÝ fÖÓÑ


bÝ di«eÖeÒØ ÑachiÒe ÐeaÖÒiÒg aÐgÓÖiØhÑ× ×Ùcha× BaÝe×iaÒ Øhe Ù×eÖ× ÓÖ bÝ Ù×iÒg ×ÓÑe iÑÔÐiciØ Ñea×ÙÖe׺

ÛÓÖk¸ cÐÙ×ØeÖiÒg¸ aÒd ÖÙÐe¹ba×ed aÔÔÖÓache׺ Ìhe

2.0.1 Overview of the Collaborative Filtering Pro- ÒeØ

Ýe×iaÒ ÒeØÛÓÖk ÑÓ deÐ [6] fÓÖÑÙÐaØe× a ÔÖÓbabiÐi×Øic ÑÓ deÐ

cess Ba

fÓÖ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ÔÖÓbÐeѺ CÐÙ×ØeÖiÒg ÑÓ deÐ ØÖeaØ×

Ìhe gÓaÐ Óf a cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ i× ØÓ ×Ùg¹

cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg a× a cÐa××i¬caØiÓÒ ÔÖÓbÐeÑ [¾¸ 6¸ ¾9]

ge×Ø ÒeÛ iØeÑ× ÓÖ ØÓ ÔÖedicØ Øhe ÙØiÐiØÝ Óf a ceÖØaiÒ iØeÑ fÓÖ

aÒd ÛÓÖk× bÝ cÐÙ×ØeÖiÒg ×iÑiÐaÖ Ù×eÖ× iÒ ×aÑe cÐa×× aÒd e×Øi¹

a ÔaÖØicÙÐaÖ Ù×eÖ ba×ed ÓÒ Øhe Ù×eÖ³× ÔÖeÚiÓÙ× ÐikiÒg× aÒd

ÑaØiÒg Øhe ÔÖÓbabiÐiØÝ ØhaØ a ÔaÖØicÙÐaÖ Ù×eÖ i× iÒ a ÔaÖØic¹

Øhe ÓÔiÒiÓÒ× Óf ÓØheÖ Ðike¹ÑiÒded Ù×eÖ׺ ÁÒ a ØÝÔicaÐ CF ×ce¹

ÙÐaÖ cÐa×× C ¸ aÒd fÖÓÑ ØheÖe cÓÑÔÙØe× Øhe cÓÒdiØiÓÒaÐ ÔÖÓb¹

ÒaÖiÓ¸ ØheÖe i× a Ði×Ø Óf Ñ Ù×eÖ× Í = fÙ ;Ù ;::: ;Ù g aÒd a

abiÐiØÝ Óf ÖaØiÒg׺ Ìhe ÖÙÐe¹ba×ed aÔÔÖÓach aÔÔÐie× a××Ó ci¹

½ ¾ Ñ

Ði×Ø Óf Ò iØeÑ× Á = fi ;i ;::: ; i gº EachÙ×eÖÙ ha× a Ði×Ø

aØiÓÒ ÖÙÐe di×cÓÚeÖÝ aÐgÓÖiØhÑ× ØÓ ¬Òd a××Ó ciaØiÓÒ b eØÛeeÒ

½ ¾ Ò i

Óf iØeÑ× Á ¸ Ûhich Øhe Ù×eÖ ha× eÜÔÖe××ed hi×»heÖ ÓÔiÒiÓÒ×

cÓ¹ÔÙÖcha×ed iØeÑ× aÒd ØheÒ geÒeÖaØe× iØeÑ ÖecÓÑÑeÒda¹



ab ÓÙغ ÇÔiÒiÓÒ× caÒ b e eÜÔÐiciØÐÝ giÚeÒ bÝ Øhe Ù×eÖ a× a Öaع

ØiÓÒ ba×ed ÓÒ Øhe ×ØÖeÒgØh Óf Øhe a××Ó ciaØiÓÒ b eØÛeeÒ iØeÑ×

iÒg ×cÓÖe¸ geÒeÖaÐÐÝ ÛiØhiÒ a ceÖØaiÒ ÒÙÑeÖicaÐ ×caÐe¸ ÓÖ caÒ


iÑÔÐiciØÐÝ deÖiÚed fÖÓÑ ÔÙÖcha×e ÖecÓÖd׸ bÝ aÒaÐÝÞiÒg

be 2.0.2 Challenges of User-based Collaborative Filter-

ÐÓg׸ bÝ ÑiÒiÒg Ûeb hÝÔ eÖÐiÒk× aÒd ×Ó ÓÒ [¾8¸ ½6]º

ØiÑiÒg ing Algorithms

ÆÓØe ØhaØ Á Á aÒd iØ i× Ô Ó××ibÐe fÓÖ Á ØÓ b e a ÒÙРй×eغ


i i

Í×eÖ¹ba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ×Ý×ØeÑ× haÚebeeÒÚeÖÝ

ÌheÖe eÜi×Ø× a di×ØiÒgÙi×hed Ù×eÖ Ù ¾Í caÐÐed Øhe acØiÚe


×Ùcce××fÙÐ iÒ Ôa×ظ bÙØ ØheiÖ Ûide×ÔÖead Ù×e ha× ÖeÚeaÐed

Ù×eÖ fÓÖ ÛhÓÑ Øhe Øa×k Óf a cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ

×ÓÑe Ô ÓØeÒØiaÐ chaÐÐeÒge× ×Ùcha×:

i× ØÓ ¬Òd aÒ iØeÑ ÐikeÐiÒe×× ØhaØ caÒ b e Óf ØÛÓ fÓÖÑ׺

¯ ËÔaÖ×iØݺ ÁÒ ÔÖacØice¸ ÑaÒÝ cÓÑÑeÖciaÐ ÖecÓÑÑeÒdeÖ

¯ ÈÖedicØiÓÒ i×aÒÙÑeÖicaÐ ÚaÐÙe¸ È ¸ eÜÔÖe××iÒg Øhe


×Ý×ØeÑ× aÖe Ù×ed ØÓ eÚaÐÙaØe ÐaÖge iØeÑ ×eØ× ´eºgº¸ AÑa¹

ÔÖedicØed ÐikeÐiÒe×× Óf iØeÑ i 6¾ Á fÓÖ Øhe acØiÚeÙ×eÖ

j Ù


ÞÓÒºcÓÑ ÖecÓÑÑeÒd× b Ó Ók× aÒd CDÒÓÛºcÓÑ ÖecÓѹ

Ù º Ìhi× ÔÖedicØed ÚaÐÙe i× ÛiØhiÒ Øhe ×aÑe ×caÐe ´eºgº¸


ÑeÒd× ÑÙ×ic aÐbÙÑ×µº ÁÒ Øhe×e ×Ý×ØeÑ׸ eÚeÒ acØiÚe

fÖÓÑ ½ ØÓ 5µ a× Øhe ÓÔiÒiÓÒ ÚaÐÙe× ÔÖÓÚided bÝ Ù º


Ù×eÖ× ÑaÝhaÚeÔÙÖcha×ed ÛeÐÐ ÙÒdeÖ ½± Óf Øhe iØeÑ×

¯ ÊecÓÑÑeÒdaØiÓÒ i×aÐi×ØÓf Æ iØeÑ׸ Á Á¸ ØhaØ

´½± Óf ¾ ÑiÐÐiÓÒ b Ó Ók× i× ¾¼; ¼¼¼ b Ó Ók×µº AccÓÖdiÒgÐݸ


Øhe acØiÚe Ù×eÖ ÛiÐÐ Ðike Øhe ÑÓ×غ ÆÓØe ØhaØ Øhe ÖecÓѹ

a ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ ba×ed ÓÒ ÒeaÖe×Ø Òeighb ÓÖ aй

ÑeÒded Ði×Ø ÑÙ×Ø b e ÓÒ iØeÑ× ÒÓØ aÐÖeadÝ ÔÙÖcha×ed bÝ

gÓÖiØhÑ× ÑaÝ b e ÙÒabÐe ØÓ ÑakeaÒÝ iØeÑ ÖecÓÑÑeÒ¹

Øhe acØiÚe Ù×eÖ¸ iºeº¸ Á \ Á =¨º Ìhi× iÒØeÖface Óf CF

daØiÓÒ× fÓÖ a ÔaÖØicÙÐaÖ Ù×eÖº A× a Öe×ÙÐØ Øhe accÙÖacÝ



aÐgÓÖiØhÑ× i× aÐ×Ó kÒÓÛÒ a× ÌÓÔ¹Æ ÖecÓÑÑeÒdaØiÓÒº


¯ ËcaÐabiÐiØݺ ÆeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ× ÖeÕÙiÖe cÓѹ

FigÙÖe ½ ×hÓÛ× Øhe ×cheÑaØic diagÖaÑ Óf Øhe cÓÐÐab ÓÖaØiÚe

ÔÙØaØiÓÒ ØhaØ gÖÓÛ× ÛiØh bÓØh Øhe ÒÙÑbeÖ Óf Ù×eÖ×

¬ÐØeÖiÒg ÔÖÓ ce×׺ CF aÐgÓÖiØhÑ× ÖeÔÖe×eÒØ Øhe eÒØiÖe Ñ ¢ Ò

aÒd Øhe ÒÙÑb eÖ Óf iØeÑ׺ ÏiØh ÑiÐÐiÓÒ× Óf Ù×eÖ× aÒd

Ù×eÖ¹iØeÑ daØa a× a ÖaØiÒg× ÑaØÖiܸ Aº EacheÒØÖÝ a iÒ A


iØeÑ׸ a ØÝÔicaÐ Ûeb¹ba×ed ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ ÖÙÒ¹

ÖeÔÖe×eÒØ× Øhe ÔÖefeÖeÒce ×cÓÖe ´ÖaØiÒg×µ Óf Øhe iØh Ù×eÖ ÓÒ

ÒiÒg eÜi×ØiÒg aÐgÓÖiØhÑ× ÛiÐÐ ×Ù«eÖ ×eÖiÓÙ× ×caÐabiÐiØÝ

Øhe j Øh iØeѺ Each iÒdiÚidÙaÐ ÖaØiÒg× i× ÛiØhiÒ a ÒÙÑeÖicaÐ


×caÐe aÒd iØ caÒ a× ÛeÐÐ be ¼ iÒdicaØiÒg ØhaØ Øhe Ù×eÖ ha×

ÒÓØ ÝeØ ÖaØed ØhaØ iØeѺ Êe×eaÖcheÖ× haÚe deÚi×ed a ÒÙѹ

Ìhe ÛeakÒe×× Óf ÒeaÖe×Ø ÒeighbÓÖ aÐgÓÖiØhÑ fÓÖ ÐaÖge¸

b eÖ Óf cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ× ØhaØ caÒ b e diÚided

×ÔaÖ×e daØaba×e× Ðed Ù× ØÓ eÜÔÐÓÖe aÐØeÖÒaØiÚe ÖecÓÑÑeÒdeÖ

iÒØÓ ØÛÓ ÑaiÒ caØegÓÖie×|ÅeÑÓÖݹba×ed ´Ù×eÖ¹ba×edµ aÒd

×Ý×ØeÑ aÐgÓÖiØhÑ׺ ÇÙÖ ¬Ö×Ø aÔÔÖÓach aØØeÑÔØed ØÓ bÖidge

ÅÓdeйba×ed ´iØeѹba×edµ aÐgÓÖiØhÑ× [6]º ÁÒ Øhi× ×ecØiÓÒ Ûe

Øhe ×ÔaÖ×iØÝbÝ iÒcÓÖÔ ÓÖaØiÒg ×eÑi¹iÒØeÐÐigeÒØ ¬ÐØeÖiÒg ageÒØ×

ÔÖÓÚide a deØaiÐed aÒaÐÝ×i× Óf CF¹ba×ed ÖecÓÑÑeÒdeÖ ×Ý×¹

iÒØÓ Øhe ×Ý×ØeÑ [¾¿¸ ½½]º Ìhe×e ageÒØ× eÚaÐÙaØed aÒd ÖaØed

ØeÑ aÐgÓÖiØhÑ׺

each iØeÑ Ù×iÒg ×ÝÒØacØic feaØÙÖe׺ BÝ ÔÖÓÚidiÒg a deÒ×e Öaع

iÒg× ×eظ ØheÝ heÐÔ ed aÐÐeÚiaØe cÓÚeÖage aÒd iÑÔÖÓÚed ÕÙaй

ÅeÑÓÖݹba×ed CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒg AÐgÓÖiØhÑ×

ݺ Ìhe ¬ÐØeÖiÒg ageÒØ ×ÓÐÙØiÓÒ¸ hÓÛeÚeÖ¸ did ÒÓØ addÖe××

. iØ

ÅeÑÓÖݹba×ed aÐgÓÖiØhÑ× ÙØiÐiÞe Øhe eÒØiÖe Ù×eÖ¹iØeÑ daØa¹

Øhe fÙÒdaÑeÒØaÐ ÔÖÓbÐeÑ Óf Ô Ó ÓÖ ÖeÐaØiÓÒ×hiÔ× aÑÓÒg Ðike¹

ba×e ØÓ geÒeÖaØe a ÔÖedicØiÓÒº Ìhe×e ×Ý×ØeÑ× eÑÔÐÓÝ×Øa¹

ÑiÒded bÙØ ×ÔaÖ×e¹ÖaØiÒg Ù×eÖ׺ ÌÓ eÜÔÐÓÖe ØhaØ Ûe ØÓ Ók

Øi×ØicaÐ ØechÒiÕÙe× ØÓ ¬Òd a ×eØ Óf Ù×eÖ׸ kÒÓÛÒ a× Òeigh¹

aÒ aÐgÓÖiØhÑic aÔÔÖÓach aÒd Ù×ed ÄaØeÒØ ËeÑaÒØic ÁÒdeܹ

bÓÖ׸ ØhaØ haÚe a hi×ØÓÖÝ Óf agÖeeiÒg ÛiØh Øhe ØaÖgeØ Ù×eÖ

iÒg ´ÄËÁµ ØÓ caÔØÙÖe Øhe ×iÑiÐaÖiØÝbeØÛeeÒ Ù×eÖ× aÒd iØeÑ×

´iºeº¸ ØheÝ eiØheÖ ÖaØe di«eÖeÒØ iØeÑ× ×iÑiÐaÖÐÝ ÓÖ ØheÝ ØeÒd

iÒ a ÖedÙced diÑeÒ×iÓÒaÐ ×Ôace [¾4¸ ¾5]º ÁÒ Øhi× ÔaÔ eÖ Ûe

ØÓ bÙÝ ×iÑiÐaÖ ×eØ Óf iØeÑ×µº ÇÒce a ÒeighbÓÖhÓÓd Óf Ù×eÖ×

ÐÓ Ók iÒØÓ aÒÓØheÖ ØechÒiÕÙe¸ Øhe ÑÓ deйba×ed aÔÔÖÓach¸ iÒ

i× fÓÖÑed¸ Øhe×e ×Ý×ØeÑ× Ù×e di«eÖeÒØ aÐgÓÖiØhÑ× ØÓ cÓѹ

addÖe××iÒg Øhe×e chaÐÐeÒge׸ e×Ô eciaÐÐÝ Øhe ×caÐabiÐiØÝ chaй

biÒe Øhe ÔÖefeÖeÒce× Óf Òeighb ÓÖ× ØÓ ÔÖÓ dÙce a ÔÖedicØiÓÒ ÓÖ

ÐeÒgeº Ìhe ÑaiÒ idea heÖe i× ØÓ aÒaÐÝÞe Øhe Ù×eÖ¹iØeÑ ÖeÔÖe¹

ØÓÔ¹Æ ÖecÓÑÑeÒdaØiÓÒ fÓÖ Øhe acØiÚeÙ×eÖº Ìhe ØechÒiÕÙe׸

×eÒØaØiÓÒ ÑaØÖiÜ ØÓ ideÒØifÝ ÖeÐaØiÓÒ× b eØÛeeÒ di«eÖeÒØ iØeÑ×

aÐ×Ó kÒÓÛÒ a× ÒeaÖe×عÒeighbÓÖ ÓÖ Ù×eÖ¹ba×ed cÓÐÐab ÓÖaØiÚe

aÒd ØheÒ ØÓ Ù×e Øhe×e ÖeÐaØiÓÒ× ØÓ cÓÑÔÙØe Øhe ÔÖedicØiÓÒ

¬ÐØeÖiÒg¸ aÖe ÑÓÖe Ô ÓÔÙÐaÖ aÒd ÛideÐÝ Ù×ed iÒ ÔÖacØiceº

×cÓÖe fÓÖ a giÚeÒ Ù×eÖ¹iØeÑ ÔaiÖº Ìhe iÒØÙiØiÓÒ b ehiÒd Øhi×

aÔÔÖÓach i× ØhaØ a Ù×eÖ ÛÓÙÐd be iÒØeÖe×Øed iÒ ÔÙÖcha×iÒg

ÅÓ deйba×ed CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒg AÐgÓÖiØhÑ× iØeÑ× ØhaØ aÖe ×iÑiÐaÖ ØÓ Øhe iØeÑ× Øhe Ù×eÖ Ðiked eaÖÐieÖ

. ÅÓ¹

aÒd ÛÓÙÐd ØeÒd ØÓ aÚÓid iØeÑ× ØhaØ aÖe ×iÑiÐaÖ ØÓ Øhe iØeÑ× deйba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ× ÔÖÓÚide iØeÑ Öec¹

Øhe Ù×eÖ didÒ³Ø Ðike eaÖÐieÖº Ìhe×e ØechÒiÕÙe× dÓÒ³Ø ÖeÕÙiÖe ÓÑÑeÒdaØiÓÒ bÝ ¬Ö×Ø deÚeÐÓÔiÒg a ÑÓ deÐ Óf Ù×eÖ ÖaØiÒg׺ Aй

ØÓ ideÒØifÝ Øhe ÒeighbÓÖhÓÓd Óf ×iÑiÐaÖ Ù×eÖ× ÛheÒ a Öec¹ gÓÖiØhÑ× iÒ Øhi× caØegÓÖÝ Øake a ÔÖÓbabiÐi×Øic aÔÔÖÓach aÒd

ÓÑÑeÒdaØiÓÒ i× ÖeÕÙe×Øed; a× a Öe×ÙÐØ ØheÝ ØeÒd ØÓ ÔÖÓ¹ eÒÚi×iÓÒ Øhe cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ÔÖÓ ce×× a× cÓÑÔÙØiÒg Øhe

dÙce ÑÙch fa×ØeÖ ÖecÓÑÑeÒdaØiÓÒ׺ AÒÙÑb eÖ Óf di«eÖeÒØ eÜÔ ecØed ÚaÐÙe Óf a Ù×eÖ ÔÖedicØiÓÒ¸ giÚeÒ hi×»heÖ ÖaØiÒg×

287 Item for which prediction is sought i1 i2 . . ij . . in

u1 u 2 P (prediction on . a,j . Prediction item j for the active user) ua . Recommendation . {Ti1, Ti2, ..., T iN} Top-N list of items for the um active user Active user

Input (ratings table) CF-Algorithm Output interface

FigÙÖe ½: Ìhe CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒg ÈÖÓ ce×׺

×cheÑe× haÚe b eeÒ ÔÖÓÔ Ó×ed ØÓ cÓÑÔÙØe Øhe a××Ó ciaØiÓÒ b e¹ ×iÑ´i; j µi×giÚeÒ bÝ

ØÛeeÒ iØeÑ× ÖaÒgiÒg fÖÓÑ ÔÖÓbabiÐi×Øic aÔÔÖÓach [6] ØÓ ÑÓÖe

~ ~

i ¡ j

ØÖadiØiÓÒaÐ iØeѹiØeÑ cÓÖÖeÐaØiÓÒ× [½5¸ ½¿]º Ïe ÔÖe×eÒØ a de¹

~ ~

×iÑ´i; j µ=cÓ×´i; j µ=

ØaiÐed aÒaÐÝ×i× Óf ÓÙÖ aÔÔÖÓach iÒ Øhe ÒeÜØ ×ecØiÓÒº

~ ~

ki k £kj k

¾ ¾


ERING ALGORITHM 3.1.2 Correlation-based Similarity

ÁÒ Øhi× ca×e¸ ×iÑiÐaÖiØÝbeØÛeeÒ ØÛÓ iØeÑ× i aÒd j i× Ñea¹

ÁÒ Øhi× ×ecØiÓÒ Ûe ×ØÙdÝ a cÐa×× Óf iØeѹba×ed ÖecÓÑÑeÒ¹

×ÙÖed bÝ cÓÑÔÙØiÒg Øhe ÈeaÖ×ÓÒ¹Ö cÓÖÖeÐaØiÓÒ cÓÖ Ö º ÌÓ

daØiÓÒ aÐgÓÖiØhÑ× fÓÖ ÔÖÓ dÙciÒg ÔÖedicØiÓÒ× ØÓ Ù×eÖ׺ ÍÒÐike


Ñake Øhe cÓÖÖeÐaØiÓÒ cÓÑÔÙØaØiÓÒ accÙÖaØe Ûe ÑÙ×Ø ¬Ö×Ø

Øhe Ù×eÖ¹ba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ di×cÙ××ed iÒ

i×ÓÐaØe Øhe cÓ¹ÖaØed ca×e× ´iºeº¸ ca×e× ÛheÖe Øhe Ù×eÖ× ÖaØed

ËecØiÓÒ ¾¸ Øhe iØeѹba×ed aÔÔÖÓach ÐÓ Ók× iÒØÓ Øhe ×eØ Óf

bÓØh i aÒd j µ a× ×hÓÛÒ iÒ FigÙÖe ¾º ÄeØ Øhe ×eØ Óf Ù×eÖ× ÛhÓ

iØeÑ× Øhe ØaÖgeØ Ù×eÖ ha× ÖaØed aÒd cÓÑÔÙØe× hÓÛ ×iÑi¹

b ÓØh ÖaØed i aÒd j aÖe deÒÓØed bÝ Í ØheÒ Øhe cÓÖÖeÐaØiÓÒ

ÐaÖ ØheÝ aÖe ØÓ Øhe ØaÖgeØ iØeÑ i aÒd ØheÒ ×eÐecØ× k ÑÓ×Ø

×iÑiÐaÖiØÝ i× giÚeÒ bÝ

×iÑiÐaÖ iØeÑ× fi ;i ; ::: ;i gº AØ Øhe ×aÑe ØiÑe ØheiÖ cÓÖ¹

½ ¾


Öe×Ô ÓÒdiÒg ×iÑiÐaÖiØie× f× ;× ;::: ;× g aÖe aÐ×Ó cÓÑÔÙØedº

i½ i¾



ÇÒce Øhe ÑÓ×Ø ×iÑiÐaÖ iØeÑ× aÖe fÓÙÒd¸ Øhe ÔÖedicØiÓÒ i×


´Ê Ê µ´Ê Ê µ

Ù;i i Ù;j j


ØheÒ cÓÑÔÙØed bÝ ØakiÒg a ÛeighØed aÚeÖage Óf Øhe ØaÖgeØ


: ×iÑ´i; j µ=


¾ ¾

Ù×eÖ³× ÖaØiÒg× ÓÒ Øhe×e ×iÑiÐaÖ iØeÑ׺ Ïe de×cÖib e Øhe×e ØÛÓ  

´Ê Ê µ ´Ê Ê µ

Ù;i i Ù;j j


a×Ô ecØ׸ ÒaÑeÐݸ Øhe ×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ aÒd Øhe ÔÖedic¹

ØiÓÒ geÒeÖaØiÓÒ iÒ deØaiÐ× heÖeº

ÀeÖe Ê deÒÓØe× Øhe ÖaØiÒg Óf Ù×eÖ Ù ÓÒ iØeÑ i¸ Ê i× Øhe

Ù;i i

ÚeÖage ÖaØiÒg Óf Øhe i¹Øh iØeѺ

3.1 Item Similarity Computation a e ¬ÐØeÖiÒg

ÇÒe cÖiØicaÐ ×ØeÔ iÒ Øhe iØeѹba×ed cÓÐÐab ÓÖaØiÚ 3.1.3 Adjusted Cosine Similarity

aÐgÓÖiØhÑ i× ØÓ cÓÑÔÙØe Øhe ×iÑiÐaÖiØÝ beØÛeeÒ iØeÑ× aÒd

ÇÒe fÙÒdaÑeÒØaÐ di«eÖeÒce b eØÛeeÒ Øhe ×iÑiÐaÖiØÝcÓѹ

ØheÒ ØÓ ×eÐecØ Øhe ÑÓ×Ø ×iÑiÐaÖ iØeÑ׺ Ìhe ba×ic idea iÒ

ÔÙØaØiÓÒ iÒ Ù×eÖ¹ba×ed CF aÒd iØeѹba×ed CF i× ØhaØ iÒ ca×e

×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ b eØÛeeÒ ØÛÓ iØeÑ× i aÒd j i× ØÓ ¬Ö×Ø

Óf Ù×eÖ¹ba×ed CF Øhe ×iÑiÐaÖiØÝ i× cÓÑÔÙØed aÐÓÒg Øhe ÖÓÛ×

i×ÓÐaØe Øhe Ù×eÖ× ÛhÓ haÚe ÖaØed b ÓØh Óf Øhe×e iØeÑ× aÒd ØheÒ

Óf Øhe ÑaØÖiÜ bÙØ iÒ ca×e Óf Øhe iØeѹba×ed CF Øhe ×iÑi¹


ÐaÖiØÝ i× cÓÑÔÙØed aÐÓÒg Øhe cÓÐÙÑÒ׸ iºeº¸ each ÔaiÖ iÒ Øhe

Øhe ×iÑiÐaÖiØÝ × º FigÙÖe ¾ iÐÐÙ×ØÖaØe× Øhi× ÔÖÓ ce××; heÖe


cÓ¹ÖaØed ×eØ cÓÖÖe×Ô ÓÒd× ØÓ a di«eÖeÒØ Ù×eÖ ´FigÙÖe ¾µº CÓѹ

Øhe ÑaØÖiÜ ÖÓÛ× ÖeÔÖe×eÒØ Ù×eÖ× aÒd Øhe cÓÐÙÑÒ× ÖeÔÖe×eÒØ

ÔÙØiÒg ×iÑiÐaÖiØÝ Ù×iÒg ba×ic cÓ×iÒe Ñea×ÙÖe iÒ iØeѹba×ed


ca×e ha× ÓÒe iÑÔ ÓÖØaÒØ dÖaÛback|Øhe di«eÖeÒce× iÒ Öaع

ÌheÖe aÖe a ÒÙÑbeÖ Óf di«eÖeÒØÛaÝ× ØÓ cÓÑÔÙØe Øhe ×iѹ

iÒg ×caÐe b eØÛeeÒ di«eÖeÒØ Ù×eÖ× aÖe ÒÓØ ØakeÒ iÒØÓ accÓÙÒغ

iÐaÖiØÝbeØÛeeÒ iØeÑ׺ ÀeÖe Ûe ÔÖe×eÒØ ØhÖee ×Ùch ÑeØhÓ d׺

Ìhe adjÙ×Øed cÓ×iÒe ×iÑiÐaÖiØÝ Ó«×eØ× Øhi× dÖaÛbackbÝ ×Ùb¹

Ìhe×e aÖe cÓ×iÒe¹ba×ed ×iÑiÐaÖiØݸ cÓÖÖeÐaØiÓÒ¹ba×ed ×iÑiÐaÖ¹

ØÖacØiÒg Øhe cÓÖÖe×Ô ÓÒdiÒg Ù×eÖ aÚeÖage fÖÓÑ each cÓ¹ÖaØed

iØÝ aÒd adjÙ×Øed¹cÓ×iÒe ×iÑiÐaÖiØݺ

ÔaiÖº FÓÖÑaÐÐݸ Øhe ×iÑiÐaÖiØÝbeØÛeeÒ iØeÑ× i aÒd j Ù×iÒg

Øhi× ×cheÑe i× giÚeÒ bÝ

3.1.1 Cosine-based Similarity È


´Ê Ê µ´Ê Ê µ

Ù;i Ù Ù;j Ù


ÁÒ Øhi× ca×e¸ ØÛÓ iØeÑ× aÖe ØhÓÙghØÓf a× ØÛÓ ÚecØÓÖ× iÒ


: ×iÑ´i; j µ=


¾ ¾


´Ê Ê µ ´Ê Ê µ

Øhe Ñ diÑeÒ×iÓÒaÐ Ù×eÖ¹×Ôaceº Ìhe ×iÑiÐaÖiØÝbeØÛeeÒ ØheÑ

Ù;i Ù Ù;j Ù


i× Ñea×ÙÖed bÝ cÓÑÔÙØiÒg Øhe cÓ×iÒe Óf Øhe aÒgÐe b eØÛeeÒ

Øhe×e ØÛÓ ÚecØÓÖ׺ FÓÖÑaÐÐݸ iÒ Øhe Ñ ¢ Ò ÖaØiÒg× ÑaØÖiÜ

ÀeÖe Ê i× Øhe aÚeÖage Óf Øhe Ù¹Øh Ù×eÖ³× ÖaØiÒg׺


iÒ FigÙÖe ¾¸ ×iÑiÐaÖiØÝ beØÛeeÒ iØeÑ× i aÒd j ¸ deÒÓØed bÝ

288 s =? i,j

1 2 3 ij n-1 n 1 R R 2 - R

Item-item similarity is computed by looking into co-rated items only. In

case of items i and j the similarity si,j is u R R computed by looking into them. Note: each of these co-rated pairs are obtained from different users, in this example they come from users 1, u and m-1. m-1 R R

m R -

FigÙÖe ¾: Á×ÓÐaØiÓÒ Óf Øhe cÓ¹ÖaØed iØeÑ× aÒd ×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ

« aÒd ¬ aÖe deØeÖÑiÒed

3.2 Prediction Computation Ìhe ÖegÖe××iÓÒ ÑÓ deÐ ÔaÖaÑeØeÖ×

bÝ gÓiÒg ÓÚeÖ b ÓØh Óf Øhe ÖaØiÒg ÚecØÓÖ׺ ¯ i× Øhe eÖÖÓÖ Óf

Ìhe ÑÓ×Ø iÑÔ ÓÖØaÒØ ×ØeÔ iÒ a cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ×Ý×¹

Øhe ÖegÖe××iÓÒ ÑÓ deк

ØeÑ i× ØÓ geÒeÖaØe Øhe ÓÙØÔÙØ iÒØeÖface iÒ ØeÖÑ× Óf ÔÖedicØiÓÒº

ÇÒce Ûe i×ÓÐaØe Øhe ×eØ Óf ÑÓ×Ø ×iÑiÐaÖ iØeÑ× ba×ed ÓÒ Øhe

Ý Ñea×ÙÖe׸ Øhe ÒeÜØ ×ØeÔ i× ØÓ ÐÓ Ók iÒØÓ Øhe ØaÖ¹

×iÑiÐaÖiØ 3.3 Performance Implications

geØ Ù×eÖ× ÖaØiÒg× aÒd Ù×e a ØechÒiÕÙe ØÓ ÓbØaiÒ ÔÖedicØiÓÒ׺

Ìhe ÐaÖge×Ø E¹CÓÑÑeÖce ×iØe× ÓÔ eÖaØe aØ a ×caÐe ØhaØ

ÀeÖe Ûe cÓÒ×ideÖ ØÛÓ ×Ùch ØechÒiÕÙe׺

×ØÖe××e× Øhe diÖecØ iÑÔÐeÑeÒØaØiÓÒ Óf cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒgº

b ÓÖhÓ Ó d¹ba×ed CF ×Ý×ØeÑ׸ Øhe Òeighb ÓÖhÓ Ó d fÓÖ¹

3.2.1 Weighted Sum ÁÒ Òeigh

ÑaØiÓÒ ÔÖÓ ce×׸ e×Ô eciaÐÐÝ Øhe Ù×eÖ¹Ù×eÖ ×iÑiÐaÖiØÝ cÓÑÔÙØa¹

A× Øhe ÒaÑe iÑÔÐie׸ Øhi× ÑeØhÓ d cÓÑÔÙØe× Øhe ÔÖedicØiÓÒ

ØiÓÒ ×ØeÔ ØÙÖÒ× ÓÙØ ØÓ b e Øhe Ô eÖfÓÖÑaÒce b ÓØØÐeÒeck¸ Ûhich

ÓÒ aÒ iØeÑ i fÓÖ a Ù×eÖ Ù bÝ cÓÑÔÙØiÒg Øhe ×ÙÑ Óf Øhe ÖaØiÒg×

iÒ ØÙÖÒ caÒ Ñake Øhe ÛhÓÐe ÔÖÓ ce×× ÙÒ×ÙiØabÐe fÓÖ ÖeaйØiÑe

giÚeÒ bÝ Øhe Ù×eÖ ÓÒ Øhe iØeÑ× ×iÑiÐaÖ ØÓ iº Each ÖaØiÒg× i×

ÖecÓÑÑeÒdaØiÓÒ geÒeÖaØiÓÒº ÇÒe ÛaÝ Óf eÒ×ÙÖiÒg high ×caй

ÛeighØed bÝ Øhe cÓÖÖe×Ô ÓÒdiÒg ×iÑiÐaÖiØÝ × beØÛeeÒ iØeÑ×


abiÐiØÝ i× ØÓ Ù×e a ÑÓ deйba×ed aÔÔÖÓachº ÅÓ deйba×ed ×Ý×¹

i aÒd j º FÓÖÑaÐÐݸ Ù×iÒg Øhe ÒÓØiÓÒ ×hÓÛÒ iÒ FigÙÖe ¿ Ûe

ØeÑ× haÚe Øhe Ô ÓØeÒØiaÐ ØÓ cÓÒØÖibÙØe ØÓ ÖecÓÑÑeÒdeÖ ×Ý×¹

caÒ deÒÓØe Øhe ÔÖedicØiÓÒ È a×


ØeÑ× ØÓ ÓÔ eÖaØe aØ a high ×caÐeº Ìhe ÑaiÒ idea heÖe ØÓ i×Ó¹


ÐaØe Øhe Òeighb ÓÖhÓ Ó d geÒeÖaØiÓÒ aÒd ÔÖedicØiÓÒ geÒeÖaØiÓÒ

´× £ Ê µ

i;Æ Ù;Æ

aÐÐ ×iÑiÐaÖ iØeÑ׸ Æ



È =


´j× jµ


ÁÒ Øhi× ÔaÔ eÖ¸ Ûe ÔÖe×eÒØ a ÑÓ deйba×ed aÔÔÖÓach ØÓ ÔÖe¹

aÐÐ ×iÑiÐaÖ iØeÑ׸ Æ

cÓÑÔÙØe iØeѹiØeÑ ×iÑiÐaÖiØÝ ×cÓÖe׺ Ìhe ×iÑiÐaÖiØÝ cÓÑÔÙ¹

Ba×icaÐÐݸ Øhi× aÔÔÖÓach ØÖie× ØÓ caÔØÙÖe hÓÛ Øhe acØiÚe

ØaØiÓÒ ×cheÑe i× ×ØiÐÐ cÓÖÖeÐaØiÓÒ¹ba×ed bÙØ Øhe cÓÑÔÙØaØiÓÒ

Ù×eÖ ÖaØe× Øhe ×iÑiÐaÖ iØeÑ׺ Ìhe ÛeighØed ×ÙÑ i× ×caÐed bÝ

i× Ô eÖfÓÖÑed ÓÒ Øhe iØeÑ ×Ôaceº ÁÒ a ØÝÔicaÐ E¹CÓÑÑeÖce

Øhe ×ÙÑ Óf Øhe ×iÑiÐaÖiØÝ ØeÖÑ× ØÓ Ñake ×ÙÖe Øhe ÔÖedicØiÓÒ

×ceÒaÖiÓ¸ Ûe Ù×ÙaÐÐÝ haÚe a ×eØ Óf iØeÑ ØhaØ i× ×ØaØic cÓѹ

i× ÛiØhiÒ Øhe ÔÖede¬Òed ÖaÒgeº

ÔaÖed ØÓ Øhe ÒÙÑb eÖ Óf Ù×eÖ× ØhaØ chaÒge× ÑÓ×Ø ÓfØeÒº Ìhe

ÒaØÙÖe Óf iØeÑ× Ðead× Ù× ØÓ Øhe idea Óf ÔÖecÓÑÔÙع

3.2.2 Regression ×ØaØic

iÒg Øhe iØeÑ ×iÑiÐaÖiØie׺ ÇÒe Ô Ó××ibÐe ÛaÝ Óf ÔÖecÓÑÔÙØiÒg

Ìhi× aÔÔÖÓach i× ×iÑiÐaÖ ØÓ Øhe ÛeighØed ×ÙÑ ÑeØhÓ d bÙØ

Øhe iØeÑ ×iÑiÐaÖiØie× i× ØÓ cÓÑÔÙØe aÐйØÓ¹aÐÐ ×iÑiÐaÖiØÝaÒd

iÒ×Øead Óf diÖecØÐÝ Ù×iÒg Øhe ÖaØiÒg× Óf ×iÑiÐaÖ iØeÑ× iØ Ù×e×

ØheÒ Ô eÖfÓÖÑiÒg a ÕÙick ØabÐe ÐÓ Ók¹ÙÔ ØÓ ÖeØÖieÚe Øhe Öe¹

aÒ aÔÔÖÓÜiÑaØiÓÒ Óf Øhe ÖaØiÒg× ba×ed ÓÒ ÖegÖe××iÓÒ ÑÓ deк

ÕÙiÖed ×iÑiÐaÖiØÝÚaÐÙe׺ Ìhi× ÑeØhÓ d¸ aÐØhÓÙgh ×aÚe× ØiÑe¸

ÁÒ ÔÖacØice¸ Øhe ×iÑiÐaÖiØie× cÓÑÔÙØed Ù×iÒg cÓ×iÒe ÓÖ cÓÖ¹


ÖeÕÙiÖe× aÒ Ç ´Ò µ ×Ôace fÓÖ Ò iØeÑ׺

ÖeÐaØiÓÒ Ñea×ÙÖe× ÑaÝ b e Ñi×ÐeadiÒg iÒ Øhe ×eÒ×e ØhaØ ØÛÓ

Ìhe facØ ØhaØ Ûe ÓÒÐÝ Òeed a ×ÑaÐÐ fÖacØiÓÒ Óf ×iÑiÐaÖ iØeÑ×

ÖaØiÒg ÚecØÓÖ× ÑaÝ b e di×ØaÒØ ´iÒ EÙcÐideaÒ ×eÒ×eµ ÝeØ ÑaÝ

ØÓ cÓÑÔÙØe ÔÖedicØiÓÒ× Ðead× Ù× ØÓ aÒ aÐØeÖÒaØe ÑÓ deйba×ed

haÚeÚeÖÝ high ×iÑiÐaÖiØݺ ÁÒ ØhaØ ca×e Ù×iÒg Øhe ÖaÛ ÖaØiÒg×

×cheÑeº ÁÒ Øhi× ×cheÑe¸ Ûe ÖeØaiÒ ÓÒÐÝ a ×ÑaÐÐ ÒÙÑbeÖ Óf

Óf Øhe \×Ó¹caÐÐed" ×iÑiÐaÖ iØeÑ ÑaÝ Öe×ÙÐØ iÒ Ô Ó ÓÖ ÔÖedicØiÓÒº

×iÑiÐaÖ iØeÑ׺ FÓÖ each iØeÑ j Ûe cÓÑÔÙØe Øhe k ÑÓ×Ø ×iѹ

Ìhe ba×ic idea i× ØÓ Ù×e Øhe ×aÑe fÓÖÑÙÐa a× Øhe ÛeighØed

iÐaÖ iØeÑ׸ ÛheÖe k  Ò aÒd ÖecÓÖd Øhe×e iØeÑ ÒÙÑbeÖ×

×ÙÑ ØechÒiÕÙe¸ bÙØ iÒ×Øead Óf Ù×iÒg Øhe ×iÑiÐaÖ iØeÑ Æ ³×

aÒd ØheiÖ ×iÑiÐaÖiØie× ÛiØh j º ÏeØeÖÑk a× Øhe ÑÓdeÐ ×iÞeº

\ÖaÛ" ÖaØiÒg× ÚaÐÙe× Ê ³×¸ Øhi× ÑÓ deÐ Ù×e× ØheiÖ aÔÔÖÓܹ



Ba×ed ÓÒ Øhi× ÑÓ deÐ bÙiÐdiÒg ×ØeÔ¸ ÓÙÖ ÔÖedicØiÓÒ geÒeÖa¹

ba×ed ÓÒ a ÐiÒeaÖ ÖegÖe××iÓÒ ÑÓ deк Áf iÑaØed ÚaÐÙe× Ê


ØiÓÒ aÐgÓÖiØhÑ ÛÓÖk× a× fÓÐÐÓÛ׺ FÓÖ geÒeÖaØiÒg ÔÖedicØiÓÒ×

Ûe deÒÓØe Øhe Öe×Ô ecØiÚeÚecØÓÖ× Óf Øhe ØaÖgeØ iØeÑ i aÒd Øhe

fÓÖ a Ù×eÖ Ù ÓÒ iØeÑ i¸ ÓÙÖ aÐgÓÖiØhÑ ¬Ö×Ø ÖeØÖieÚe× Øhe ÔÖe¹

×iÑiÐaÖ iØeÑ Æ bÝ Ê aÒd Ê Øhe ÐiÒeaÖ ÖegÖe××iÓÒ ÑÓ deÐ

i Æ

cÓÑÔÙØed k ÑÓ×Ø ×iÑiÐaÖ iØeÑ× cÓÖÖe×Ô ÓÒdiÒg ØÓ Øhe ØaÖgeØ

caÒ b e eÜÔÖe××ed a×

iØeÑ iº ÌheÒ iØ ÐÓ Ók× hÓÛÑaÒÝ Óf ØhÓ×e k iØeÑ× ÛeÖe ÔÙÖ¹


= «Ê · ¬ · ¯ Ê cha×ed bÝ Øhe Ù×eÖ Ù¸ ba×ed ÓÒ Øhi× iÒØeÖ×ecØiÓÒ ØheÒ Øhe

i Æ

289 123 i-1i i+1 n-1 n 1

2 1 2 3 i-1i m-1 m u R R R - R

si,i-1 si,3 s s u R R R - R i,1 i,m






weighted sum regression-based m

2nd 1st 4th 3rd 5th

Ranking of the items similar to the i-th item

FigÙÖe ¿: ÁØeѹba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhѺ Ìhe ÔÖedicØiÓÒ geÒeÖaØiÓÒ ÔÖÓ ce×× i× iÐÐÙ×ØÖaØed fÓÖ 5


ÔÖedicØiÓÒ i× cÓÑÔÙØed Ù×iÒg ba×ic iØeѹba×ed cÓÐÐab ÓÖaØiÚe ÖÓÛ× ´iºeº¸ 94¿ Ù×eÖ×µ aÒd ½68¾ cÓÐÙÑÒ× ´iºeº¸ ½68¾ ÑÓÚie×

¬ÐØeÖiÒg aÐgÓÖiØhѺ ØhaØ ÛeÖe ÖaØed bÝ aØ Ðea×Ø ÓÒe Óf Øhe Ù×eÖ×µº FÓÖ ÓÙÖ eܹ

Ïe Ób×eÖÚe a ÕÙaÐiØÝ¹Ô eÖfÓÖÑaÒce ØÖade¹Ó« heÖe: ØÓ eÒ¹ Ô eÖiÑeÒØ׸ Ûe aÐ×Ó Øake aÒÓØheÖ facØÓÖ iÒØÓ cÓÒ×ideÖaØiÓÒ¸

×ÙÖe gÓ Ó d ÕÙaÐiØÝÛeÑÙ×Ø haÚe a ÐaÖge ÑÓ deÐ ×iÞe¸ Ûhich ×ÔaÖ×iØÝ ÐeÚeÐ Óf daØa ×eØ׺ FÓÖ Øhe daØa ÑaØÖiÜ Ê Ìhi× i×


Ðead× ØÓ Øhe Ô eÖfÓÖÑaÒce ÔÖÓbÐeÑ× di×cÙ××ed ab ÓÚeº ÁÒ ÓÒe

º Ìhe ×ÔaÖ×iØÝ ÐeÚeÐ Óf Øhe de¬Òed a× ½


eÜØÖeÑe¸ Ûe caÒ haÚe a ÑÓ deÐ ×iÞe Óf Ò¸ Ûhich ÛiÐÐ eÒ×ÙÖe Øhe


ÅÓÚie daØa ×eØ i׸ ØheÖefÓÖe¸ ½ ¸ Ûhichi×¼:9¿69º


eÜacØ ×aÑe ÕÙaÐiØÝ a× Øhe ÓÖigiÒaÐ ×cheÑe bÙØ ÛiÐÐ haÚehigh

ÌhÖÓÙghÓÙØ Øhe ÔaÔ eÖ Ûe ØeÖÑ Øhi× daØa ×eØ a× Åĺ

×Ôace cÓÑÔÐeÜiØݺÀÓÛeÚeÖ¸ ÓÙÖ ÑÓ deÐ bÙiÐdiÒg ×ØeÔ eÒ×ÙÖe× e ÖeØaiÒ Øhe ÑÓ×Ø ×iÑiÐaÖ iØeÑ׺ ÏhiÐe geÒeÖaØiÒg ÔÖe¹

ØhaØ Û 4.2 Evaluation Metrics

dicØiÓÒ׸ Øhe×e iØeÑ× cÓÒØÖibÙØe Øhe ÑÓ×Ø ØÓ Øhe ÔÖedicØiÓÒ

ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× Öe×eaÖch ha× Ù×ed ×eÚeÖaÐ ØÝÔ e× Óf

×cÓÖe׺ AccÓÖdiÒgÐݸÛehÝÔ ÓØhe×iÞe ØhaØ Øhi× ÑÓ deйba×ed

Ñea×ÙÖe× fÓÖ eÚaÐÙaØiÒg Øhe ÕÙaÐiØÝ Óf a ÖecÓÑÑeÒdeÖ ×Ý×¹

aÔÔÖÓach ÛiÐÐ ÔÖÓÚide Öea×ÓÒabÐÝ gÓÓd ÔÖedicØiÓÒ ÕÙaÐiØÝ

ØeѺ ÌheÝ caÒ b e ÑaiÒÐÝ caØegÓÖiÞed iÒØÓ ØÛÓ cÐa××e×:

ÛiØh eÚeÒ a ×ÑaÐÐ ÑÓ deÐ ×iÞe aÒd heÒce ÔÖÓÚide a gÓ Ó d Ô eÖ¹

fÓÖÑaÒceº Ïe eÜÔ eÖiÑeÒØaÐÐÝ ÚaÐidaØe ÓÙÖ hÝÔ ÓØhe×i× ÐaØeÖ

¯ ËØaØi×ØicaÐ accÙÖacÝ ÑeØÖic× eÚaÐÙaØe Øhe accÙÖacÝ Óf a

iÒ Øhi× ÔaÔ eÖº ÁÒ ÔaÖØicÙÐaÖ¸ Ûe eÜÔ eÖiÑeÒØ ÛiØh Øhe ÑÓ deÐ

×Ý×ØeÑ bÝ cÓÑÔaÖiÒg Øhe ÒÙÑeÖicaÐ ÖecÓÑÑeÒdaØiÓÒ

×iÞe bÝ ÚaÖÝiÒg Øhe ÒÙÑbeÖ Óf ×iÑiÐaÖ iØeÑ× ØÓ be ×ØÓÖedº

×cÓÖe× agaiÒ×Ø Øhe acØÙaÐ Ù×eÖ ÖaØiÒg× fÓÖ Øhe Ù×eÖ¹iØeÑ

ÌheÒ Ûe Ô eÖfÓÖÑ eÜÔ eÖiÑeÒØ× ØÓ cÓÑÔÙØe ÔÖedicØiÓÒ aÒd

ÔaiÖ× iÒ Øhe Øe×Ø daØa×eغ ÅeaÒ Ab×ÓÐÙØe EÖÖÓÖ ´ÅAEµ

Öe×Ô ÓÒ×e¹ØiÑe ØÓ deØeÖÑiÒe Øhe iÑÔacØ Óf Øhe ÑÓ deÐ ×iÞe ÓÒ

beØÛeeÒ ÖaØiÒg× aÒd ÔÖedicØiÓÒ× i× a ÛideÐÝ Ù×ed Ñeع

ÕÙaÐiØÝ aÒd Ô eÖfÓÖÑaÒce Óf Øhe ÛhÓÐe ×Ý×ØeѺ

Öicº ÅAE i× a Ñea×ÙÖe Óf Øhe deÚiaØiÓÒ Óf ÖecÓÑÑeÒ¹

aÐÙe׺ FÓÖ each


ÖaØiÒg×¹ÔÖedicØiÓÒ ÔaiÖ <Ô ;Õ > Øhi× ÑeØÖic ØÖeaØ× Øhe

i i

ab×ÓÐÙØe eÖÖÓÖ b eØÛeeÒ ØheѸ iºeº¸ jÔ Õ j eÕÙaÐÐݺÌhe i

4.1 Data set i

ÅAE i× cÓÑÔÙØed bÝ ¬Ö×Ø ×ÙÑÑiÒg Øhe×e ab×ÓÐÙØe eÖ¹

Ïe Ù×ed eÜÔ eÖiÑeÒØaÐ daØa fÖÓÑ ÓÙÖ Öe×eaÖchÛeb×iØe ØÓ

ÖÓÖ× Óf Øhe Æ cÓÖÖe×Ô ÓÒdiÒg ÖaØiÒg×¹ÔÖedicØiÓÒ ÔaiÖ×

eÚaÐÙaØe di«eÖeÒØÚaÖiaÒØ× Óf iØeѹba×ed ÖecÓÑÑeÒdaØiÓÒ aй

aÒd ØheÒ cÓÑÔÙØiÒg Øhe aÚeÖageº FÓÖÑaÐÐݸ




jÔ Õ j

i i



Ïe Ù×ed daØa fÖÓÑ ÓÙÖ ÅÓÚieÄeÒ× ÖecÓѹ ÅÓÚie daØa

. Æ

ÑeÒdeÖ ×Ý×ØeѺ ÅÓÚieÄeÒ× i× a Ûeb¹ba×ed Öe×eaÖchÖecÓѹ

Ìhe ÐÓÛeÖ Øhe ÅAE¸ Øhe ÑÓÖe accÙÖaØeÐÝ Øhe ÖecÓѹ

ÑeÒdeÖ ×Ý×ØeÑ ØhaØ debÙØed iÒ FaÐÐ ½997º EachÛeek hÙÒ¹

ÑeÒdaØiÓÒ eÒgiÒe ÔÖedicØ× Ù×eÖ ÖaØiÒg׺ ÊÓÓØ ÅeaÒ

dÖed× Óf Ù×eÖ× Úi×iØ ÅÓÚieÄeÒ× ØÓ ÖaØe aÒd ÖeceiÚe ÖecÓѹ


ÑeÒdaØiÓÒ× fÓÖ ÑÓÚie׺ Ìhe ×iØe ÒÓÛha×ÓÚeÖ 4¿¼¼¼ Ù×eÖ×

a× ×ØaØi×ØicaÐ accÙÖacÝ ÑeØÖicº

ÛhÓ haÚe eÜÔÖe××ed ÓÔiÒiÓÒ× ÓÒ ¿5¼¼· di«eÖeÒØÑÓÚie׺ Ïe

ÖaÒdÓÑÐÝ ×eÐecØed eÒÓÙgh Ù×eÖ× ØÓ ÓbØaiÒ ½¼¼; ¼¼¼ ÖaØiÒg×

¯ Deci×iÓÒ ×ÙÔÔÓÖØ accÙÖacÝ ÑeØÖic× eÚaÐÙaØe hÓÛ e«ec¹ fÖÓÑ Øhe daØaba×e ´Ûe ÓÒÐÝ cÓÒ×ideÖed Ù×eÖ× ØhaØ had ÖaØed

ØiÚe a ÔÖedicØiÓÒ eÒgiÒe i× aØ heÐÔiÒg a Ù×eÖ ×eÐecØ high¹ ¾¼ ÓÖ ÑÓÖe ÑÓÚie×µº Ïe diÚided Øhe daØaba×e iÒØÓ a ØÖaiÒ¹

ÕÙaÐiØÝ iØeÑ× fÖÓÑ Øhe ×eØ Óf aÐÐ iØeÑ׺ Ìhe×e ÑeØÖic× iÒg ×eØ aÒd a Øe×Ø ×eغ FÓÖ Øhi× ÔÙÖÔ Ó×e¸ Ûe iÒØÖÓ dÙced a

a××ÙÑe Øhe ÔÖedicØiÓÒ ÔÖÓ ce×× a× a biÒaÖÝ ÓÔ eÖaØiÓÒ¹ ÚaÖiabÐe ØhaØ deØeÖÑiÒe× ÛhaØ Ô eÖceÒØage Óf daØa i× Ù×ed a×

eiØheÖ iØeÑ× aÖe ÔÖedicØed ´gÓ Ó dµ ÓÖ ÒÓØ ´badµº ÏiØh ØÖaiÒiÒg aÒd Øe×Ø ×eØ×; Ûe caÐÐ Øhi× ÚaÖiabÐe ܺ A ÚaÐÙe Óf

Øhi× Ób×eÖÚaØiÓÒ¸ ÛheØheÖ a iØeÑ ha× a ÔÖedicØiÓÒ ×cÓÖe Ü =¼:8ÛÓÙÐd iÒdicaØe 8¼± Óf Øhe daØa Ûa× Ù×ed a× ØÖaiÒ¹

Óf ½:5ÓÖ¾:5ÓÒa¬Úe¹Ô ÓiÒØ ×caÐe i× iÖÖeÐeÚaÒØ if Øhe Ù×eÖ iÒg ×eØ aÒd ¾¼± Óf Øhe daØa Ûa× Ù×ed a× Øe×Ø ×eغ Ìhe daØa

ÓÒÐÝ chÓ Ó×e× ØÓ cÓÒ×ideÖ ÔÖedicØiÓÒ× Óf 4 ÓÖ higheÖº Ìhe ×eØ Ûa× cÓÒÚeÖØed iÒØÓ a Ù×eÖ¹iØeÑ ÑaØÖiÜ A ØhaØ had 94¿


ÑÓ×Ø cÓÑÑÓÒÐÝ Ù×ed deci×iÓÒ ×ÙÔÔ ÓÖØ accÙÖacÝ Ñeع Relative performance of different similarity

ÖeÚeÖ×aÐ ÖaØe¸ ÛeighØedeÖÖÓÖ× aÒd ÊÇC ×eÒ×i¹

Öic× aÖe measures

ØiÚiØÝ [¾¿]º 0.86


Ïe Ù×ed ÅAE a× ÓÙÖ chÓice Óf eÚaÐÙaØiÓÒ ÑeØÖic ØÓ Öe¹


ÔÖedicØiÓÒ eÜÔ eÖiÑeÒØ× b ecaÙ×e iØ i× ÑÓ×Ø cÓÑÑÓÒÐÝ

ÔÓÖØ 0.8


Ù×ed aÒd ea×ie×Ø 0.78

Ø× [¾¿] ÛehaÚe ×eeÒ ØhaØ ÅAE aÒd ÊÇC ÔÖÓÚide Øhe Ô eÖiÑeÒ 0.76


Ø eÜÔ eÖiÑeÒØaÐ ×cheÑe× iÒ ØeÖÑ× Óf ×aÑe ÓÖdeÖiÒg Óf di«eÖeÒ 0.74


ÔÖedicØiÓÒ ÕÙaÐiØݺ 0.7 4.2.1 Experimental Procedure 0.68 0.66

Adjusted cosine Pure cosine Correlation

e ×ØaÖØed ÓÙÖ eÜÔ eÖiÑeÒØ× bÝ ¬Ö×Ø

Experimental steps. Ï

diÚidiÒg Øhe daØa ×eØ iÒØÓ a ØÖaiÒiÒg aÒd a Øe×Ø Ô ÓÖØiÓÒº Be¹

FigÙÖe 4: ÁÑÔacØ Óf Øhe ×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ Ñea¹

fÓÖe ×ØaÖØiÒg fÙÐÐ eÜÔ eÖiÑeÒØaÐ eÚaÐÙaØiÓÒ Óf di«eÖeÒØ aÐgÓ¹

×ÙÖe ÓÒ iØeѹba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhѺ

ÖiØhÑ× Ûe deØeÖÑiÒed Øhe ×eÒ×iØiÚiØÝÓfdi«eÖeÒØ ÔaÖaÑeØeÖ×

ØÓ di«eÖeÒØ aÐgÓÖiØhÑ× aÒd fÖÓÑ Øhe ×eÒ×iØiÚiØÝ ÔÐÓØ× Ûe¬Üed

Øhe ÓÔØiÑÙÑ ÚaÐÙe× Óf Øhe×e ÔaÖaÑeØeÖ× aÒd Ù×ed ØheÑ fÓÖ


Øhe Öe×Ø Óf Øhe eÜÔ eÖiÑeÒØ׺ ÌÓ deØeÖÑiÒe Øhe ÔaÖaÑeØeÖ

Øhe Òeighb ÓÖhÓ Ó d aÒd Ù×ed ÛeighØed ×ÙÑ aÐgÓÖiØhÑ ØÓ geÒ¹

×eÒ×iØiÚiØݸÛeÛÓÖk ÓÒÐÝ ÛiØh Øhe ØÖaiÒiÒg daØa aÒd fÙÖØheÖ

eÖaØe Øhe ÔÖedicØiÓÒº Ïe ÖaÒ Øhe×e eÜÔ eÖiÑeÒØ× ÓÒ ÓÙÖ ØÖaiÒ¹

×Ùb diÚide iØ iÒØÓ a ØÖaiÒiÒg aÒd Øe×Ø Ô ÓÖØiÓÒ aÒd caÖÖied ÓÒ

iÒg daØa aÒd Ù×ed Øe×Ø ×eØ ØÓ cÓÑÔÙØe ÅeaÒ Ab×ÓÐÙØe EÖÖÓÖ

ÓÙÖ eÜÔ eÖiÑeÒØ× ÓÒ ØheѺ FÓÖ cÓÒdÙcØed a ½¼¹fÓÐd cÖÓ×× Úaй

´ÅAEµº FigÙÖe 4 ×hÓÛ× Øhe eÜÔ eÖiÑeÒØaÐ Öe×ÙÐØ׺ ÁØ caÒ b e

idaØiÓÒ Óf ÓÙÖ eÜÔ eÖiÑeÒØ× bÝ ÖaÒdÓÑÐÝ chÓ Ó×iÒg di«eÖeÒØ

Ób×eÖÚed fÖÓÑ Øhe Öe×ÙÐØ× ØhaØ Ó«×eØØiÒg Øhe Ù×eÖ¹aÚeÖage fÓÖ

ØÖaiÒiÒg aÒd Øe×Ø ×eØ× each ØiÑe aÒd ØakiÒg Øhe aÚeÖage Óf

cÓ×iÒe ×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ ha× a cÐeaÖ adÚaÒØage¸ a× Øhe

Øhe ÅAE ÚaÐÙe׺

ÅAE i× ×igÒi¬caÒØÐÝ ÐÓÛeÖ iÒ Øhi× ca×eº ÀeÒce¸ Ûe ×eÐecØ Øhe

adjÙ×Øed cÓ×iÒe ×iÑiÐaÖiØÝ fÓÖ Øhe Öe×Ø Óf ÓÙÖ eÜÔ eÖiÑeÒØ׺

Ó cÓÑÔaÖe Øhe Ô eÖfÓÖ¹

Benchmark user-based system. Ì

e aÐ×Ó eÒØeÖed Øhe ØÖaiÒiÒg

ÑaÒce Óf iØeѹba×ed ÔÖedicØiÓÒ Û 4.3.2 Sensitivity of Training/Test Ratio

ÖaØiÒg× ×eØ iÒØÓ a cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ÖecÓÑÑeÒdaØiÓÒ eÒ¹

ÌÓ deØeÖÑiÒe Øhe ×eÒ×iØiÚiØÝ Óf deÒ×iØÝ Óf Øhe daØa ×eظ Ûe

giÒe ØhaØ eÑÔÐÓÝ× Øhe ÈeaÖ×ÓÒ ÒeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ

caÖÖied ÓÙØ aÒ eÜÔ eÖiÑeÒØ ÛheÖe Ûe ÚaÖied Øhe ÚaÐÙe Óf Ü

´Ù×eÖ¹Ù×eÖµº FÓÖ Øhi× ÔÙÖÔ Ó×e Ûe iÑÔÐeÑeÒØed a ­eÜibÐe ÔÖe¹

fÖÓÑ ¼:¾ ØÓ ¼:9 iÒ aÒ iÒcÖeÑeÒØÓf ¼:½º FÓÖ each Óf Øhe×e

dicØiÓÒ eÒgiÒe ØhaØ iÑÔÐeÑeÒØ× Ù×eÖ¹ba×ed CF aÐgÓÖiØhÑ׺

ØÖaiÒiÒg»Øe×Ø ÖaØiÓ ÚaÐÙe× Ûe ÖaÒ ÓÙÖ eÜÔ eÖiÑeÒØ× Ù×iÒg Øhe

Ïe ØÙÒed Øhe aÐgÓÖiØhÑ ØÓ Ù×e Øhe b e×Ø ÔÙbÐi×hed ÈeaÖ×ÓÒ

ØÛÓ ÔÖedicØiÓÒ geÒeÖaØiÓÒ ØechÒiÕÙe×ßba×ic ÛeighØed ×ÙÑ

ÒeaÖe×Ø Òeighb ÓÖ aÐgÓÖiØhÑ aÒd cÓÒ¬gÙÖed iØ ØÓ deÐiÚeÖ Øhe

aÒd ÖegÖe××iÓÒ ba×ed aÔÔÖÓachº ÇÙÖ Öe×ÙÐØ× aÖe ×hÓÛÒ iÒ

highe×Ø ÕÙaÐiØÝ ÔÖedicØiÓÒ ÛiØhÓÙØ cÓÒceÖÒ fÓÖ Ô eÖfÓÖÑaÒce

FigÙÖe 5º Ïe Ób×eÖÚe ØhaØ Øhe ÕÙaÐiØÝ Óf ÔÖedicØiÓÒ iÒcÖea×e

´iºeº¸ iØ cÓÒ×ideÖed eÚeÖÝ Ô Ó××ibÐe ÒeighbÓÖØÓfÓÖÑÓÔØiÑaÐ

a× Ûe iÒcÖea×e ܺ Ìhe ÖegÖe××iÓÒ¹ba×ed aÔÔÖÓach×hÓÛ× b eع


ØeÖ Öe×ÙÐØ× ØhaÒ Øhe ba×ic ×cheÑe fÓÖ ÐÓÛ ÚaÐÙe× Óf Ü bÙØ

a× Ûe iÒcÖea×e Ü Øhe ÕÙaÐiØÝ ØeÒd× ØÓ faÐÐ b eÐÓÛ Øhe ba×ic


heÑeº FÖÓÑ Øhe cÙÖÚe׸ Ûe ×eÐecØ Ü =¼:8 a× aÒ ÓÔØiÑÙÑ

Experimental platform. ×c

ÑeÒØed Ù×iÒg C aÒd cÓÑÔiÐed Ù×iÒg ÓÔØiÑiÞaØiÓÒ ­ag ¼6º


Ïe ÖaÒ aÐÐ ÓÙÖ eÜÔ eÖiÑeÒØ× ÓÒ a ÐiÒÙÜ ba×ed ÈC ÛiØh ÁÒØeÐ

eÒØiÙÑ Á Á Á ÔÖÓ ce××ÓÖ haÚiÒg a ×Ô eed Óf 6¼¼ ÅÀÞ aÒd ¾GB

È 4.3.3 Experiments with neighborhood size

Óf ÊAź

Ìhe ×iÞe Óf Øhe Òeighb ÓÖhÓ Ó d ha× ×igÒi¬caÒØ iÑÔacØ ÓÒ Øhe

Ý [½¾]º ÌÓ deØeÖÑiÒe Øhe ×eÒ×iØiÚiØÝ Óf Øhi×

4.3 Experimental Results ÔÖedicØiÓÒ ÕÙaÐiØ

ÔaÖaÑeØeÖ¸ Ûe Ô eÖfÓÖÑed aÒ eÜÔ eÖiÑeÒØ ÛheÖe Ûe ÚaÖied

ÁÒ Øhi× ×ecØiÓÒ Ûe ÔÖe×eÒØ ÓÙÖ eÜÔ eÖiÑeÒØaÐ Öe×ÙÐØ× Óf aÔ¹

Øhe ÒÙÑbeÖ Óf ÒeighbÓÖ× ØÓ be Ù×ed aÒd cÓÑÔÙØed ÅAEº

ÔÐÝiÒg iØeѹba×ed cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg ØechÒiÕÙe× fÓÖ geÒ¹

ÇÙÖ Öe×ÙÐØ× aÖe ×hÓÛÒ iÒ FigÙÖe 5º Ïe caÒ Ób×eÖÚe ØhaØ

eÖaØiÒg ÔÖedicØiÓÒ׺ ÇÙÖ Öe×ÙÐØ× aÖe ÑaiÒÐÝ diÚided iÒØÓ ØÛÓ

Øhe ×iÞe Óf ÒeighbÓÖhÓÓd dÓ e× a«ecØ Øhe ÕÙaÐiØÝÓf ÔÖedic¹

ÔaÖØ×|ÕÙaÐiØÝ Öe×ÙÐØ× aÒd Ô eÖfÓÖÑaÒce Öe×ÙÐØ׺ ÁÒ a××e××¹

ØiÓÒº BÙØ Øhe ØÛÓ ÑeØhÓ d× ×hÓÛ di«eÖeÒØØÝÔ e× Óf ×eÒ×iØiÚ¹

iÒg Øhe ÕÙaÐiØÝ Óf ÖecÓÑÑeÒdaØiÓÒ׸ Ûe ¬Ö×Ø deØeÖÑiÒed Øhe

iØݺ Ìhe ba×ic iØeѹiØeÑ aÐgÓÖiØhÑ iÑÔÖÓÚe× a× Ûe iÒcÖea×e

×eÒ×iØiÚiØÝ Óf ×ÓÑe ÔaÖaÑeØeÖ× b efÓÖe ÖÙÒÒiÒg Øhe ÑaiÒ eܹ

Øhe Òeighb ÓÖhÓ Ó d ×iÞe fÖÓÑ ½¼ ØÓ ¿¼¸ afØeÖ ØhaØ Øhe ÖaØe Óf

Ô eÖiÑeÒغ Ìhe×e ÔaÖaÑeØeÖ× iÒcÐÙde Øhe Òeighb ÓÖhÓ Ó d ×iÞe¸

iÒcÖea×e diÑiÒi×he× aÒd Øhe cÙÖÚe ØeÒd× ØÓ b e ­aغ ÇÒ Øhe

Øhe ÚaÐÙe Óf Øhe ØÖaiÒiÒg»Øe×Ø ÖaØiÓ Ü¸ aÒd e«ecØ× Óf di«eÖeÒØ

ÓØheÖ haÒd¸ Øhe ÖegÖe××iÓÒ¹ba×ed aÐgÓÖiØhÑ ×hÓÛ× decÖea×e

×iÑiÐaÖiØÝ Ñea×ÙÖe׺ FÓÖ deØeÖÑiÒiÒg Øhe ×eÒ×iØiÚiØÝÓfÚaÖ¹

iÒ ÔÖedicØiÓÒ ÕÙaÐiØÝ ÛiØh iÒcÖea×ed ÒÙÑbeÖ Óf Òeighb ÓÖ׺

iÓÙ× ÔaÖaÑeØeÖ׸ ÛefÓcÙ×ed ÓÒÐÝ ÓÒ Øhe ØÖaiÒiÒg daØa ×eØ

CÓÒ×ideÖiÒg b ÓØh ØÖeÒd× Ûe ×eÐecØ ¿¼ a× ÓÙÖ ÓÔØiÑaÐ chÓice

aÒd fÙÖØheÖ diÚided iØ iÒØÓ a ØÖaiÒiÒg aÒd a Øe×Ø Ô ÓÖØiÓÒ aÒd

Óf Òeighb ÓÖhÓ Ó d ×iÞeº Ù×ed ØheÑ ØÓ ÐeaÖÒ Øhe ÔaÖaÑeØeÖ׺ 4.3.4 Quality Experiments

4.3.1 Effect of Similarity Algorithms

ÇÒce Ûe ÓbØaiÒ Øhe ÓÔØiÑaÐ ÚaÐÙe× Óf Øhe ÔaÖaÑeØeÖ׸ Ûe

Ïe iÑÔÐeÑeÒØed ØhÖee di«eÖeÒØ ×iÑiÐaÖiØÝ aÐgÓÖiØhÑ× ba¹ cÓÑÔaÖe b ÓØh Óf ÓÙÖ iØeѹba×ed aÔÔÖÓache× ÛiØh Øhe b eÒch¹

×ic cÓ×iÒe¸ adjÙ×Øed cÓ×iÒe aÒd cÓÖÖeÐaØiÓÒ a× de×cÖib ed iÒ ÑaÖk Ù×eÖ¹ba×ed aÐgÓÖiØhѺ Ïe ÔÖe×eÒØ Øhe Öe×ÙÐØ× iÒ Fig¹

ËecØiÓÒ ¿º½ aÒd Øe×Øed ØheÑ ÓÒ ÓÙÖ daØa ×eØ׺ FÓÖ each×iÑi¹ ÙÖe 6º ÁØ caÒ be Ób×eÖÚed fÖÓÑ Øhe chaÖØ× ØhaØ Øhe ba×ic

291 Sensitivity of the parameter x Sensitivity of the Neighborhood Size

0.87 0.85 0.751 0.83

0.81 0.746

MAE 0.79 MAE 0.77 0.741 0.75 0.73 0.736

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10 20 30 40 50 60 70 80 90

100 125 150 175 200 Train/test ratio, x No. of Neighbors

itm-itm itm-reg itm-itm itm-reg

FigÙÖe 5: ËeÒ×iØiÚiØÝ Óf Øhe ÔaÖaÑeØeÖ Ü ÓÒ Øhe Òeighb ÓÖhÓ Ó d ×iÞe

iØeѹiØeÑ aÐgÓÖiØhÑ ÓÙØ Ô eÖfÓÖÑ× Øhe Ù×eÖ ba×ed aÐgÓÖiØhÑ Sensitivity of the model size

(at selected train/test ratio)

aØ aÐÐ ÚaÐÙe× Óf Ü ´Òeighb ÓÖhÓ Ó d ×iÞe = ¿¼µ aÒd aÐÐ ÚaÐÙe× Óf

Òeighb ÓÖhÓ Ó d ×iÞe ´Ü =¼:8µº FÓÖ eÜaÑÔÐe¸ aØ Ü =¼:5 Ù×eÖ¹


Ù×eÖ ×cheÑe ha× aÒ ÅAE Óf ¼:755 aÒd iØeѹiØeÑ ×cheÑe


×hÓÛ× aÒ ÅAE Óf ¼:749º ËiÑiÐaÖÐÝ aØ a Òeighb ÓÖhÓ Ó d ×iÞe Óf


6¼ Ù×eÖ¹Ù×eÖ aÒd iØeѹiØeÑ ×cheÑe× ×hÓÛ ÅAE Óf ¼:7¿¾ aÒd 0.78


:7¾6 Öe×Ô ecØiÚeÐݺ Ìhe ÖegÖe××iÓÒ¹ba×ed aÐgÓÖiØhѸ hÓÛ¹

¼ 0.76

eÖ¸ ×hÓÛ× iÒØeÖe×ØiÒg behaÚiÓÖº AØ ÐÓÛ ÚaÐÙe× Óf Ü aÒd

eÚ 0.74

Û Òeighb ÓÖhÓ Ó d ×iÞe iØ ÓÙØ Ô eÖfÓÖÑ× Øhe ÓØheÖ ØÛÓaй aØ ÐÓ 0.72

25 50 75 100 125 150 175 200 item-item

gÓÖiØhÑ׸ bÙØ a× Øhe deÒ×iØÝ Óf Øhe daØa ×eØ i× iÒcÖea×ed

Model size

ÓÖ a× Ûe add ÑÓÖe Òeighb ÓÖ× iØ Ô eÖfÓÖÑ× ÛÓÖ×e¸ eÚeÒ cÓѹ

Ïe aÐ×Ó cÓÑÔaÖed ÓÙÖ

ÔaÖed ØÓ Øhe Ù×eÖ¹ba×ed aÐgÓÖiØhѺ x=0.3 x=0.5 x=0.8

aÐgÓÖiØhÑ× agaiÒ×Ø Øhe ÒaiÚe ÒÓÒÔ eÖ×ÓÒaÐiÞed aÐgÓÖiØhÑ de¹

×cÖib ed iÒ [½¾]º

FigÙÖe 7: ËeÒ×iØiÚiØÝ Óf Øhe ÑÓ deÐ ×iÞe ÓÒ iØeѹba×ed

ÏedÖaÛØÛÓ cÓÒcÐÙ×iÓÒ× fÖÓÑ Øhe×e Öe×ÙÐØ׺ FiÖ×ظ iØeѹ

cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ

ba×ed aÐgÓÖiØhÑ× ÔÖÓÚide b eØØeÖ ÕÙaÐiØÝ ØhaÒ Øhe Ù×eÖ¹ba×ed

aÐgÓÖiØhÑ× aØ aÐÐ ×ÔaÖ×iØÝ ÐeÚeÐ׺ ËecÓÒd¸ ÖegÖe××iÓÒ¹ba×ed

aÐgÓÖiØhÑ× Ô eÖfÓÖÑ b eØØeÖ ÛiØh ÚeÖÝ ×ÔaÖ×e daØa ×eظ bÙØ a×

Ûe add ÑÓÖe daØa Øhe ÕÙaÐiØÝgÓe×dÓÛÒº Ïe b eÐieÚeØhi×

haÔÔ eÒ× a× Øhe ÖegÖe××iÓÒ ÑÓ deÐ ×Ù«eÖ× fÖÓÑ daØa ÓÚeÖ¬ØØiÒg


aØ high deÒ×iØÝÐeÚeÐ׺

ÛiØh Øhe fÙÐÐ ÑÓ deÐ ×iÞe ´iºeº¸ ÑÓ deÐ ×iÞe = ÒÓº Óf iØeÑ×µ

e aÐ×Ó ÖaÒ Øhe ×aÑe Øe×Ø cÓÒ×ideÖiÒg aÐÐ ×iÑiÐaÖiØÝ ÚaÐÙe×

4.3.5 Performance Results Û

aÒd Ôicked b e×Ø k fÓÖ ÔÖedicØiÓÒ geÒeÖaØiÓÒº Ïe ÖeÔ eaØed

AfØeÖ ×hÓÛiÒg ØhaØ Øhe iØeѹba×ed aÐgÓÖiØhÑ ÔÖÓÚide× b eع

Øhe eÒØiÖe ÔÖÓ ce×× fÓÖ ØhÖee di«eÖeÒØ Ü ÚaÐÙe× ´ØÖaiÒiÒg»Øe×Ø

ØeÖ ÕÙaÐiØÝ Óf ÔÖedicØiÓÒ ØhaÒ Øhe Ù×eÖ¹ba×ed aÐgÓÖiØhѸ Ûe

ÖaØiÓ×µº FigÙÖe 7 ×hÓÛ× Øhe ÔÐÓØ× aØ di«eÖeÒØ Ü ÚaÐÙe׺ ÁØ

fÓ cÙ× ÓÒ Øhe ×caÐabiÐiØÝ i××Ùe׺ A× di×cÙ××ed eaÖÐieÖ¸ iØeѹ

caÒ be Ób×eÖÚed fÖÓÑ Øhe ÔÐÓØ× ØhaØ Øhe ÅAE ÚaÐÙe× geØ

ba×ed ×iÑiÐaÖiØÝ i× ÑÓÖe ×ØaØic aÒd aÐÐÓÛ× Ù× ØÓ ÔÖecÓÑÔÙØe

b eØØeÖ a× Ûe iÒcÖea×e Øhe ÑÓ deÐ ×iÞe aÒd Øhe iÑÔÖÓÚeÑeÒØ×

Øhe iØeÑ Òeighb ÓÖhÓ Ó dº Ìhi× ÔÖecÓÑÔÙØaØiÓÒ Óf Øhe ÑÓ deÐ

aÖe dÖa×Øic aØ Øhe b egiÒÒiÒg¸ bÙØ gÖadÙaÐÐÝ ×ÐÓÛdÓÛÒ a× Ûe

ha× ceÖØaiÒ Ô eÖfÓÖÑaÒce b eÒe¬Ø׺ ÌÓÑake Øhe ×Ý×ØeÑ eÚeÒ

iÒcÖea×e Øhe ÑÓ deÐ ×iÞeº Ìhe ÑÓ×Ø iÑÔ ÓÖØaÒØ Ób×eÖÚaØiÓÒ

ÑÓÖe ×caÐabÐe Ûe ÐÓ Óked iÒØÓ Øhe ×eÒ×iØiÚiØÝ Óf Øhe ÑÓ deÐ

fÖÓÑ Øhe×e ÔÐÓØ× i× Øhe high accÙÖacÝ ØhaØ caÒ b e achieÚed

×iÞe aÒd ØheÒ ÐÓ Óked iÒØÓ Øhe iÑÔacØ Óf ÑÓ deÐ ×iÞe ÓÒ Øhe

Ù×iÒg ÓÒÐÝ a fÖacØiÓÒ Óf iØeÑ׺ FÓÖ eÜaÑÔÐe¸ aØ Ü =¼:¿ Øhe

Öe×Ô ÓÒ×e ØiÑe aÒd ØhÖÓÙghÔÙغ

fÙÐÐ iØeѹiØeÑ ×cheÑe ÔÖÓÚided aÒ ÅAE Óf ¼:787¿¸ bÙØ Ù×iÒg

ÑÓ deÐ ×iÞe Óf ÓÒÐÝ ¾5¸ ÛeÛeÖe abÐe ØÓ achieÚeaÒÅAE

4.4 Sensitivity of the Model Size a

ÚaÐÙe Óf ¼:84¾º AØ Ü = ¼:8 Øhe×e ÒÙÑb eÖ× aÖe eÚeÒ ÑÓÖe

ÌÓ eÜÔ eÖiÑeÒØaÐÐÝ deØeÖÑiÒe Øhe iÑÔacØ Óf Øhe ÑÓ deÐ ×iÞe aÔÔ eaÐiÒg|fÓÖ Øhe fÙÐÐ iØeѹiØeÑ Ûe had aÒ ÅAE Óf ¼:7¾6

ÓÒ Øhe ÕÙaÐiØÝ Óf Øhe ÔÖedicØiÓÒ¸ Ûe ×eÐecØiÚeÐÝ ÚaÖied Øhe bÙØ Ù×iÒg a ÑÓ deÐ ×iÞe Óf ÓÒÐÝ ¾5 ÛeÛeÖe abÐe ØÓ ÓbØaiÒ aÒ

ÒÙÑb eÖ Óf iØeÑ× ØÓ b e Ù×ed fÓÖ ×iÑiÐaÖiØÝ cÓÑÔÙØaØiÓÒ fÖÓÑ ÅAE Óf ¼:754¸ aÒd Ù×iÒg a ÑÓ deÐ ×iÞe Óf 5¼ Øhe ÅAE Ûa×

¾5 ØÓ ¾¼¼ iÒ aÒ iÒcÖeÑeÒØÓf¾5º A ÑÓ deÐ ×iÞe Óf Ð ÑeaÒ× ØhaØ ¼:7¿8º ÁÒ ÓØheÖ ÛÓÖd׸ aØ Ü =¼:8ÛeÛeÖe ÛiØhiÒ 96± aÒd

Ûe ÓÒÐÝ cÓÒ×ideÖed Ð b e×Ø ×iÑiÐaÖiØÝÚaÐÙe× fÓÖ ÑÓ deÐ bÙiÐd¹ 98:¿± Óf Øhe fÙÐÐ iØeѹiØeÑ ×cheÑe³× accÙÖacÝ Ù×iÒg ÓÒÐÝ

iÒg aÒd ÐaØeÖ Ù×ed k Óf ØheÑ fÓÖ Øhe ÔÖedicØiÓÒ geÒeÖaØiÓÒ ½:9± aÒd ¿± Óf Øhe iØeÑ׸ Öe×Ô ecØiÚeÐÝ!

ÔÖÓ ce×׸ ÛheÖe k <к Í×iÒg Øhe ØÖaiÒiÒg daØa ×eØ ÛeÔÖe¹ Ìhi× ÑÓ deÐ ×iÞe ×eÒ×iØiÚiØÝ ha× iÑÔ ÓÖØaÒØ Ô eÖfÓÖÑaÒce iѹ

cÓÑÔÙØed Øhe iØeÑ ×iÑiÐaÖiØÝ Ù×iÒg di«eÖeÒØ ÑÓ deÐ ×iÞe× aÒd ÔÐicaØiÓÒ׺ ÁØ aÔÔ eaÖ× fÖÓÑ Øhe ÔÐÓØ× ØhaØ iØ i× Ù×efÙÐ ØÓ ÔÖe¹

ØheÒ Ù×ed ÓÒÐÝ Øhe ÛeighØed ×ÙÑ ÔÖedicØiÓÒ geÒeÖaØiÓÒ Øech¹ cÓÑÔÙØe Øhe iØeÑ ×iÑiÐaÖiØie× Ù×iÒg ÓÒÐÝ a fÖacØiÓÒ Óf iØeÑ×

ÒiÕÙe ØÓ ÔÖÓÚide Øhe ÔÖedicØiÓÒ׺ Ïe ØheÒ Ù×ed Øhe Øe×Ø daØa aÒd ÝeØ Ô Ó××ibÐe ØÓ ÓbØaiÒ gÓ Ó d ÔÖedicØiÓÒ ÕÙaÐiØݺ

292 Item-item vs. User-user at Selected Item-item vs. User-user at Selected Neighborhood Sizes (at x=0.8) Density Levels (at No. of Nbr = 30)

0.755 0.84 0.75 0.82 0.745 0.8 0.74 0.78


MAE 0.735 0.76 0.73 0.74 0.725 0.72 10 20 60 90 125 200 0.2 0.5 0.8 0.9 No. of neighbors Train/test ratio, x user-user item-item user-user item-item

item-item-regression nonpers item-item-regression nonpers

FigÙÖe 6: CÓÑÔaÖi×ÓÒ Óf ÔÖedicØiÓÒ ÕÙaÐiØÝÓfiØeѹiØeÑ aÒd Ù×eÖ¹Ù×eÖ cÓÐÐab ÓÖaØiÚe ¬ÐØeÖiÒg aÐgÓÖiØhÑ׺ Ïe

cÓÑÔaÖe ÔÖedicØiÓÒ ÕÙaÐiØie× aØ Ü =¼:¾; ¼:5; ¼:8 aÒd ¼:9º

FÙÖØheÖÑÓÖe¸ dÙe ØÓ Øhe ÑÓ deйba×ed aÔ¹

4.4.1 Impact of the model size on run-time and through- ÐiÒe Ô eÖfÓÖÑaÒceº h¸ iØ i× Ô Ó××ibÐe ØÓ ÖeØaiÒ ÓÒÐÝ a ×ÑaÐÐ ×Ùb×eØ Óf iØeÑ×

put ÔÖÓac

aÒd ÔÖÓ dÙce Öea×ÓÒabÐÝ gÓÓd ÔÖedicØiÓÒ ÕÙaÐiØݺ ÇÙÖ eܹ

GiÚeÒ Øhe ÕÙaÐiØÝ Óf ÔÖedicØiÓÒ i× Öea×ÓÒabÐÝ gÓ Ó d ÛiØh

Ô eÖiÑeÒØaÐ Öe×ÙÐØ× ×ÙÔÔ ÓÖØ ØhaØ cÐaiѺ ÌheÖefÓÖe¸ Øhe iØeѹ

×ÑaÐÐ ÑÓ deÐ ×iÞe¸ Ûe fÓ cÙ× ÓÒ Øhe ÖÙÒ¹ØiÑe aÒd ØhÖÓÙghÔÙØ

iØeÑ ×cheÑe i× caÔabÐe iÒ addÖe××iÒg Øhe ØÛÓ ÑÓ×Ø iÑÔ ÓÖØaÒØ

Óf Øhe ×Ý×ØeѺ Ïe ÖecÓÖded Øhe ØiÑe ÖeÕÙiÖed ØÓ geÒeÖaØe

chaÐÐeÒge× Óf ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ× fÓÖ E¹CÓÑÑeÖceßÕÙaÐiØÝ

ÔÖedicØiÓÒ× fÓÖ Øhe eÒØiÖe Øe×Ø ×eØ aÒd ÔÐÓØØed ØheÑ iÒ a

Óf ÔÖedicØiÓÒ aÒd high Ô eÖfÓÖÑaÒceº

chaÖØ ÛiØh ÚaÖÝiÒg ÑÓ deÐ ×iÞeº Ïe ÔÐÓØØed Øhe ÖÙÒ ØiÑe aØ

di«eÖeÒØ Ü ÚaÐÙe׺ FigÙÖe 8 ×hÓÛ× Øhe ÔÐÓغ ÆÓØe heÖe ØhaØ

Ü = ¼:¾5 Øhe ÛhÓÐe ×Ý×ØeÑ ha× ØÓ Ñake ÔÖedicØiÓÒ fÓÖ


¾5; ¼¼¼ Øe×Ø ca×e׺ FÖÓÑ Øhe ÔÐÓØ Ûe Ób×eÖÚe a ×Ùb×ØaÒØiaÐ

ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× aÖe a Ô ÓÛeÖfÙÐ ÒeÛ ØechÒÓÐÓgÝ fÓÖ

di«eÖeÒce iÒ Øhe ÖÙÒ¹ØiÑe b eØÛeeÒ Øhe ×ÑaÐÐ ÑÓ deÐ ×iÞe aÒd

eÜØÖacØiÒg addiØiÓÒaÐ ÚaÐÙe fÓÖ a bÙ×iÒe×× fÖÓÑ iØ× Ù×eÖ daØa¹

Øhe fÙÐÐ iØeѹiØeÑ ÔÖedicØiÓÒ ca×eº FÓÖ Ü =¼:¾5 Øhe ÖÙÒ¹ØiÑe

ba×e׺ Ìhe×e ×Ý×ØeÑ× heÐÔ Ù×eÖ× ¬Òd iØeÑ× ØheÝ ÛaÒØØÓbÙÝ

i× ¾:¼¼¾ ×ecÓÒd× fÓÖ a ÑÓ deÐ ×iÞe Óf ¾¼¼ a× ÓÔÔ Ó×ed ØÓ ½4:½½

fÖÓÑ a bÙ×iÒe×׺ ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× b eÒe¬Ø Ù×eÖ× bÝeÒ¹

fÓÖ Øhe ba×ic iØeѹiØeÑ ca×eº Ìhi× di«eÖeÒce i× eÚeÒ ÑÓÖe

abÐiÒg ØheÑ ØÓ ¬Òd iØeÑ× ØheÝ Ðikeº CÓÒÚeÖ×eÐݸ ØheÝ heÐÔ

ÔÖÓÑiÒeÒØ ÛiØh Ü =¼:8 ÛheÖe a ÑÓ deÐ ×iÞe Óf ¾¼¼ ÖeÕÙiÖe×

Øhe bÙ×iÒe×× bÝ geÒeÖaØiÒg ÑÓÖe ×aÐe׺ ÊecÓÑÑeÒdeÖ ×Ý×¹

ÓÒÐÝ ½:¾9¾ ×ecÓÒd× aÒd Øhe ba×ic iØeѹiØeÑ ca×e ÖeÕÙiÖe×

ØeÑ× aÖe ÖaÔidÐÝ b ecÓÑiÒg a cÖÙciaÐ ØÓ ÓÐ iÒ E¹cÓÑÑeÖce ÓÒ

¿6:¿4 ×ecÓÒd׺

Øhe Ïebº ÊecÓÑÑeÒdeÖ ×Ý×ØeÑ× aÖe b eiÒg ×ØÖe××ed bÝ Øhe

Ìhe×e ÖÙÒ¹ØiÑe ÒÙÑbeÖ× ÑaÝ b e Ñi×ÐeadiÒg a× ÛecÓѹ

hÙge ÚÓÐÙÑe Óf Ù×eÖ daØa iÒ eÜi×ØiÒg cÓÖÔ ÓÖaØe daØaba×e׸

ÔÙØed ØheÑ fÓÖ di«eÖeÒØ ØÖaiÒiÒg»Øe×Ø ÖaØiÓ× ÛheÖe Øhe ÛÓÖk¹

aÒd ÛiÐÐ be ×ØÖe××ed eÚeÒ ÑÓÖe bÝ Øhe iÒcÖea×iÒg ÚÓÐÙÑe

ÐÓad ×iÞe¸ iºeº¸ ÒÙÑb eÖ Óf ÔÖedicØiÓÒ× ØÓ b e geÒeÖaØed i× dif¹

Óf Ù×eÖ daØa aÚaiÐabÐe ÓÒ Øhe Ïebº ÆeÛ ØechÒÓÐÓgie× aÖe

feÖeÒØ ´ÖecaÐÐ ØhaØ aØ Ü = ¼:¿ ÓÙÖ aÐgÓÖiØhÑ Ù×e× ¿¼; ¼¼¼

Òeeded ØhaØ caÒ dÖaÑaØicaÐÐÝ iÑÔÖÓÚe Øhe ×caÐabiÐiØÝ Óf Öec¹

ÖaØiÒg× a× ØÖaiÒiÒg daØa aÒd Ù×e× Øhe Öe×Ø Óf 7¼; ¼¼¼ ÖaØiÒg×

ÓÑÑeÒdeÖ ×Ý×ØeÑ׺

a× Øe×Ø daØa ØÓ cÓÑÔaÖe ÔÖedicØiÓÒ× geÒeÖaØed bÝ Øhe ×Ý×ØeÑ

ÁÒ Øhi× ÔaÔ eÖ Ûe ÔÖe×eÒØed aÒd eÜÔ eÖiÑeÒØaÐÐÝ eÚaÐÙaØed

ØÓ Øhe acØÙaÐ ÖaØiÒg×µº ÌÓ ÑakeØheÒÙÑb eÖ× cÓÑÔaÖabÐe Ûe

a ÒeÛ aÐgÓÖiØhÑ fÓÖ CF¹ba×ed ÖecÓÑÑeÒdeÖ ×Ý×ØeÑ׺ ÇÙÖ

cÓÑÔÙØe Øhe ØhÖÓÙghÔÙØ ´ÔÖedicØiÓÒ× geÒeÖaØed Ô eÖ ×ecÓÒdµ

Öe×ÙÐØ× ×hÓÛ ØhaØ iØeѹba×ed ØechÒiÕÙe× hÓÐd Øhe ÔÖÓÑi×e Óf

fÓÖ Øhe ÑÓ deÐ ba×ed aÒd ba×ic iØeѹiØeÑ ×cheÑe׺ FigÙÖe 8

aÐÐÓÛiÒg CF¹ba×ed aÐgÓÖiØhÑ× ØÓ ×caÐe ØÓ ÐaÖge daØa ×eØ× aÒd

chaÖØ× Øhe×e Öe×ÙÐØ׺ Ïe ×ee ØhaØ fÓÖ Ü =¼:¿ aÒd aØ a ÑÓ deÐ

aØ Øhe ×aÑe ØiÑe ÔÖÓ dÙce high¹ÕÙaÐiØÝ ÖecÓÑÑeÒdaØiÓÒ׺

×iÞe Óf ½¼¼ Øhe ×Ý×ØeÑ geÒeÖaØe× 7¼; ¼¼¼ ÖaØiÒg× iÒ ½:487 ×ec¹

ÓÒd× ÔÖÓ dÙciÒg a ØhÖÓÙghÔÙØ ÖaØe Óf 47; ¿6½ ÛheÖe a× Øhe

ba×ic iØeѹiØeÑ ×cheÑe ÔÖÓ dÙced a ØhÖÓÙghÔÙØ Óf 496½ ÓÒÐݺ

Ø Ü =¼:8 Øhe×e ØÛÓÒÙÑb eÖ× aÖe ¾½; 5¼5 aÒd 55¼ Öe×Ô ec¹



FÙÒdiÒg fÓÖ Øhi× Öe×eaÖch Ûa× ÔÖÓÚided iÒ ÔaÖØ bÝ Øhe

ÆaØiÓÒaÐ ËcieÒce FÓÙÒdaØiÓÒ ÙÒdeÖ gÖaÒØ× Á ÁË 96½¿96¼¸ Á ÁË

aÒd Á ÁË 99787½7 ÛiØh addiØiÓÒaÐ fÙÒdiÒg bÝÆeØ

4.5 Discussion 97¿444¾¸

ÈeÖceÔØiÓÒ× ÁÒcº Ìhi× ÛÓÖk Ûa× aÐ×Ó ×ÙÔÔ ÓÖØed bÝ ÆËF

FÖÓÑ Øhe eÜÔ eÖiÑeÒØaÐ eÚaÐÙaØiÓÒ Óf Øhe iØeѹiØeÑ cÓÐÐab¹

CCʹ997¾5½9¸ EÁA¹9986¼4¾¸ ACÁ¹998¾¾74 bÝ AÖÑÝ Êe×eaÖch

ÓÖaØiÚe ¬ÐØeÖiÒg ×cheÑe ÛeÑake ×ÓÑe iÑÔ ÓÖØaÒØ Ób×eÖÚa¹

ÇÆce cÓÒØÖacØ DA»DAAG55¹98¹½¹¼44½¸ bÝ Øhe DÇE AËCÁ

ØiÓÒ׺ FiÖ×ظ Øhe iØeѹiØeÑ ×cheÑe ÔÖÓÚide× b eØØeÖ ÕÙaÐiØÝ


Óf ÔÖedicØiÓÒ× ØhaÒ Øhe Ù×e¹Ù×eÖ ´k¹ÒeaÖe×Ø ÒeighbÓÖµ ×cheÑeº

×eaÖchCeÒØeÖ cÓÒØÖacØ ÒÙÑbeÖ DAAÀ¼4¹95¹C¹¼¼¼8º Acce××

Ìhe iÑÔÖÓÚeÑeÒØ iÒ ÕÙaÐiØÝ i× cÓÒ×i×ØeÒØÓÚeÖ di«eÖeÒØ Òeigh¹

ØÓ cÓÑÔÙØiÒg faciÐiØie× Ûa× ÔÖÓÚided bÝ AÀÈCÊC¸ ÅiÒ¹

b ÓÖhÓ Ó d ×iÞe aÒd ØÖaiÒiÒg»Øe×Ø ÖaØiÓº ÀÓÛeÚeÖ¸ Øhe iÑÔÖÓÚe¹


ÑeÒØi× ÒÓØ ×igÒi¬caÒØÐÝ ÐaÖgeº Ìhe ×ecÓÒd Ób×eÖÚaØiÓÒ i×

ÑÓÙ× ÖeÚieÛeÖ× fÓÖ ØheiÖ ÚaÐÙabÐe cÓÑÑeÒØ׺

ØhaØ Øhe iØeÑ Òeighb ÓÖhÓ Ó d i× faiÖÐÝ ×ØaØic¸ Ûhich caÒ be

ÔÓØeÒØiaÐÐÝ ÔÖe¹cÓÑÔÙØed¸ Ûhich Öe×ÙÐØ× iÒ ÚeÖÝ high ÓÒ¹

293 Recommendation time vs. Model size Throughput vs. Model size (at selected train/test ratio) (at selected train/test ratio)

35.75 100000 30.75 80000 25.75 60000 e (sec.) 20.75 15.75 40000 10.75 20000

Rec. tim 5.75 0.75 0

Throughput (recs./sec) 25 50 75 100 125 150 175 200 item- 25 50 75 100 125 150 175 200 item- item item Model size Model size

x=0.3 x=0.5 x=0.8 x=0.3 x=0.5 x=0.8

FigÙÖe 8: ÊecÓÑÑeÒdaØiÓÒ ØiÑe aÒd ØhÖÓÙghÔÙØ cÓÑÔaÖi×ÓÒ b eØÛeeÒ ÑÓ deйba×ed ×cheÑe aÒd fÙÐÐ iØeѹiØeÑ

×cheÑeº Ìhe cÓÑÔaÖi×ÓÒ× aÖe ×hÓÛÒ aØ ØhÖee di«eÖeÒØ Ü ÚaÐÙe׺

Ø× fÓÖ BeØØeÖ ÊecÓÑÑeÒdaØiÓÒ׺ ÁÒ ÈÖÓceediÒg× Óf


Øhe AAAÁ³99 cÓÒfeÖeÒce¸ ÔÔº 4¿9¹446º

[½] AggaÖÛaи Cº Cº¸ ÏÓÐf¸ º ĺ¸ ÏÙ¸ ú¸ aÒd YÙ¸ Ⱥ˺

[½¾] ÀeÖÐÓ ckeÖ¸ º¸ ÃÓÒ×ØaÒ¸ º¸ BÓÖcheÖ׸ Aº¸ aÒd Êiedи º

´½999µº ÀÓÖØiÒg ÀaØche× aÒ Egg: A ÆeÛ

´½999µº AÒ AÐgÓÖiØhÑic FÖaÑeÛÓÖk fÓÖ ÈeÖfÓÖÑiÒg


CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒgº ÁÒ ÈÖÓceediÒg× Óf ACÅ

ÁÒ ÈÖÓceediÒg× Óf Øhe ACÅ ÃDD³99 CÓÒfeÖeÒceº ËaÒ


DiegÓ¸ CAº ÔÔº ¾¼½¹¾½¾º

[½¿] ÀeÖÐÓ ckeÖ¸ º ´¾¼¼¼µº ÍÒdeÖ×ØaÒdiÒg aÒd ÁÑÔÖÓÚiÒg

[¾] Ba×Ù¸ Cº¸ ÀiÖ×h¸ Àº¸ aÒd CÓheÒ¸ Ϻ ´½998µº


ÊecÓÑÑeÒdaØiÓÒ a× CÐa××i¬caØiÓÒ: Í×iÒg ËÓ ciaÐ aÒd

Ìhe×i׸ CÓÑÔÙØeÖ ËcieÒce DeÔغ¸ ÍÒiÚeÖ×iØÝ Óf



ÊecÓÑÑeÒdeÖ ËÝ×ØeÑ ÏÓÖk×hÓÔ³98º ÔÔº ½½¹½5º

[½4] ÀiÐи Ϻ¸ ËØead¸ ĺ¸ ÊÓ×eÒ×ØeiÒ¸ ź¸ aÒd FÙÖÒa׸ Gº

[¿] BeÖÖݸ ź Ϻ¸ DÙÑai׸ ˺ ̺¸ aÒd dzBÖiaÒ¸ Gº Ϻ

´½995µº ÊecÓÑÑeÒdiÒg aÒd EÚaÐÙaØiÒg ChÓice× iÒ a

´½995µº Í×iÒg ÄiÒeaÖ AÐgebÖa fÓÖ ÁÒØeÐÐigeÒØ

ÎiÖØÙaÐ CÓÑÑÙÒiØÝ Óf Í×eº ÁÒ ÈÖÓceediÒg× Óf CÀÁ ³95º

ÁÒfÓÖÑaØiÓÒ ÊeØÖieÚaк ËÁAÅ ÊeÚieÛ¸ ¿7´4µ¸ ÔÔº


[½5] ÃaÖÝÔi׸ Gº ´¾¼¼¼µº EÚaÐÙaØiÓÒ Óf ÁØeѹBa×ed ÌÓÔ¹Æ


[4] BiÐÐ×Ù׸ Dº¸ aÒd ÈaÞÞaÒi¸ ź º ´½998µº ÄeaÖÒiÒg

C˹Ìʹ¼¼¹46¸ CÓÑÔÙØeÖ ËcieÒce DeÔغ¸ ÍÒiÚeÖ×iØÝÓf



ÁCÅÄ ³98º ÔÔº 46¹5¿º

[½6] ÃÓÒ×ØaÒ¸ º¸ ÅiÐÐeÖ¸ Bº¸ ÅaÐØÞ¸ Dº¸ ÀeÖÐÓ ckeÖ¸ º¸

[5] BÖachÑaÒ¸ ʺ¸ º¸ ÃhabaÞa¸ ̺¸ ÃÐÓ e×geÒ¸ Ϻ¸

GÓÖdÓÒ¸ ĺ¸ aÒd Êiedи º ´½997µº GÖÓÙÔÄeÒ×:

ÈiaØeØ×kݹËhaÔiÖÓ¸ Gº¸ aÒd ËiÑÓÙdi׸ Eº ½996º ÅiÒiÒg


BÙ×iÒe×× DaØaba×e׺ CÓÑÑÙÒicaØiÓÒ× Óf Øhe ACŸ

CÓÑÑÙÒicaØiÓÒ× Óf Øhe ACŸ 4¼´¿µ¸ ÔÔº 77¹87º

¿9´½½µ¸ ÔÔº 4¾¹48¸ ÆÓÚeÑbeÖº

[½7] ÄiÒg¸ Cº Xº¸ aÒd Äi¸ Cº ´½998µº DaØa ÅiÒiÒg fÓÖ DiÖecØ

[6] BÖee×e¸ º ˺¸ ÀeckeÖÑaÒ¸ Dº¸ aÒd Ãadie¸ Cº ´½998µº

ÅaÖkeØiÒg: ÈÖÓbÐeÑ× aÒd ËÓÐÙØiÓÒ׺ ÁÒ ÈÖÓceediÒg× Óf

EÑÔiÖicaÐ AÒaÐÝ×i× Óf ÈÖedicØiÚe AÐgÓÖiØhÑ× fÓÖ

Øhe 4Øh ÁÒØeÖÒaØiÓÒaÐ CÓÒfeÖeÒce ÓÒ ÃÒÓÛ Ðedge

CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒgº ÁÒ ÈÖÓceediÒg× Óf Øhe ½4Øh

Di×cÓÚeÖÝ aÒd DaØa ÅiÒiÒg¸ ÔÔº 7¿¹79º

CÓÒfeÖeÒceÓÒÍÒceÖØaiÒØÝ iÒ AÖØi¬ciaÐ ÁÒØeÐ ÐigeÒce¸

ÔÔº 4¿¹5¾º

[½8] ÈeÔÔ eÖ׸ Dº¸ aÒd ÊÓgeÖ׸ ź ´½997µº Ìhe ÇÒe ØÓ ÇÒe

FÙØÙÖe : BÙiÐdiÒg ÊeÐaØiÓÒ×hiÔ× ÇÒe CÙ×ØÓÑeÖ aØ a

[7] CÙÖeØÓÒ¸ Eº Eº¸ aÒd D³AgÓ×ØiÒÓ¸ ʺ Bº ´½98¿µº FacØÓÖ

ÌiÑeº BaÒØaÑ DÓÙbÐedaÝ DeÐ Ð ÈÙbÐi×hiÒgº


a××ÓciaØe× ÔÙb׺ ÀiÐÐ×daÐe¸ ƺ

[½9] Êe×Òick¸ Ⱥ¸ ÁacÓÚÓÙ¸ ƺ¸ ËÙchak¸ ź¸ BeÖg×ØÖÓѸ Ⱥ¸

aÒd Êiedи º ´½994µº GÖÓÙÔÄeÒ×: AÒ ÇÔ eÒ

[8] DeeÖÛe×ØeÖ¸ ˺¸ DÙÑai׸ ˺ ̺¸ FÙÖÒa׸ Gº Ϻ¸


ÄaÒdaÙeÖ¸ ̺ ú¸ aÒd ÀaÖ×hÑaÒ¸ ʺ ´½99¼µº ÁÒdeÜiÒg

ÈÖÓceediÒg× Óf CËCÏ ³94¸ ChaÔ eÐ ÀiÐи ÆCº

bÝÄaØeÒØ ËeÑaÒØic AÒaÐÝ×i׺ ÂÓÙÖÒaÐ Óf Øhe AÑeÖicaÒ

ËÓcieØÝ fÓÖ ÁÒfÓÖÑaØiÓÒ ËcieÒce¸ 4½´6µ¸ ÔÔº ¿9½¹4¼7º

[¾¼] Êe×Òick¸ Ⱥ¸ aÒd ÎaÖiaÒ¸ Àº ʺ ´½997µº ÊecÓÑÑeÒdeÖ

ËÝ×ØeÑ׺ ËÔ eciaÐ i××Ùe Óf CÓÑÑÙÒicaØiÓÒ× Óf Øhe

[9] FaÝÝad¸ ͺ ź¸ ÈiaØeØ×kݹËhaÔiÖÓ¸ Gº¸ ËÑÝØh¸ Ⱥ¸ aÒd

ACź 4¼´¿µº

ÍØhÙÖÙ×aÑݸ ʺ¸ Ed׺ ´½996µº AdÚaÒce× iÒ ÃÒÓÛÐedge

Di×cÓÚeÖÝ aÒd DaØa ÅiÒiÒgº AAAÁ ÔÖe××»ÅÁÌ ÔÖe×׺

[¾½] ÊeichheÐd¸ Fº ʺ¸ aÒd Ëa××eÖ ÂÖº¸ Ϻ ´½99¼µº ZeÖÓ

DefecØiÓÒ×: ÉÙaÐiØÝ CÓÑe× ØÓ ËeÖÚice׺ ÀaÖÚaÖd

[½¼] GÓÐdb eÖg¸ Dº¸ ÆichÓÐ׸ Dº¸ Çki¸ Bº ź¸ aÒd ÌeÖÖݸDº

BÙ×iÒe×× ËchÓÓÐ ÊeÚieÛ¸ ½99¼´5µ: ÔÔº ½¼5¹½½½º

´½99¾µº Í×iÒg CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒg ØÓ ÏeaÚeaÒ


[¾¾] ÊeichheÐd¸ Fº ʺ ´½99¿µº ÄÓÝaÐØݹBa×ed ÅaÒageÑeÒغ


ÀaÖÚaÖd BÙ×iÒe×× ËchÓÓÐ ÊeÚieÛ¸ ½99¿´¾µ: ÔÔº 64¹7¿º

[½½] GÓ Ó d¸ ƺ¸ ËchafeÖ¸ Bº¸ ÃÓÒ×ØaÒ¸ º¸ BÓÖcheÖ׸ Aº¸

[¾¿] ËaÖÛaÖ¸ Bº ź¸ ÃÓÒ×ØaÒ¸ º Aº¸ BÓÖcheÖ׸ Aº¸

ËaÖÛaÖ¸ Bº¸ ÀeÖÐÓ ckeÖ¸ º¸ aÒd Êiedи º ´½999µº

ÀeÖÐÓ ckeÖ¸ º¸ ÅiÐÐeÖ¸ Bº¸ aÒd Êiedи º ´½998µº Í×iÒg



[¾7] ËhaÖdaÒaÒd¸ ͺ¸ aÒd Åae׸ Ⱥ ´½995µº ËÓ ciaÐ Ø× ØÓ ÁÑÔÖÓÚe ÈÖedicØiÓÒ ÉÙaÐiØÝiÒØhe

FiÐØeÖiÒg AgeÒ


³ÏÓÖd Óf ÅÓÙØh³º ÁÒ ÈÖÓceediÒg× Óf CÀÁ ³95ºDeÒÚeÖ¸ ÁÒ ÈÖÓceediÒg× Óf CËCÏ ³98¸ ËeaØØÐe¸ ÏAº


[¾4] ËaÖÛaÖ¸ Bº ź¸ ÃaÖÝÔi׸ Gº¸ ÃÓÒ×ØaÒ¸ º Aº¸ aÒd Êiedи

[¾8] ÌeÖÚeeÒ¸ ĺ¸ ÀiÐи Ϻ¸ AÑeÒØÓ¸ Bº¸ ÅcDÓÒaÐd¸ Dº¸ aÒd º ´¾¼¼¼µº AÔÔÐicaØiÓÒ Óf DiÑeÒ×iÓÒaÐiØÝ ÊedÙcØiÓÒ iÒ

CÖeØeÖ¸ º ´½997µº ÈÀÇAÃË: A ËÝ×ØeÑ fÓÖ ËhaÖiÒg ÊecÓÑÑeÒdeÖ ËÝ×ØeÑßA Ca×e ËØÙdݺÁÒ ACÅ

ÊecÓÑÑeÒdaØiÓÒ׺ CÓÑÑÙÒicaØiÓÒ× Óf Øhe ACŸ ÏebÃDD ¾¼¼¼ ÏÓÖk×hÓÔº

4¼´¿µº ÔÔº 59¹6¾º

[¾5] ËaÖÛaÖ¸ Bº ź¸ ÃaÖÝÔi׸ Gº¸ ÃÓÒ×ØaÒ¸ º Aº¸ aÒd Êiedи

[¾9] ÍÒgaÖ¸ ĺ Àº¸ aÒd FÓ×ØeÖ¸ Dº Ⱥ ´½998µ CÐÙ×ØeÖiÒg º ´¾¼¼¼µº AÒaÐÝ×i× Óf ÊecÓÑÑeÒdaØiÓÒ AÐgÓÖiØhÑ× fÓÖ

ÅeØhÓ d× fÓÖ CÓÐÐab ÓÖaØiÚe FiÐØeÖiÒgº ÁÒ ÏÓÖk×hÓÔ ÓÒ E¹CÓÑÑeÖceº ÁÒ ÈÖÓceediÒg× Óf Øhe ACÅ EC³¼¼

ÊecÓÑÑeÒdeÖ ËÝ×ØeÑ× aØ Øhe ½5Øh ÆaØiÓÒaÐ CÓÒfeÖeÒceº ÅiÒÒeaÔ ÓÐi׸ Åƺ ÔÔº ½58¹½67

CÓÒfeÖeÒceÓÒAÖØi¬ciaÐ ÁÒØeÐ ÐigeÒceº

[¾6] ËchafeÖ¸ º Bº¸ ÃÓÒ×ØaÒ¸ º¸ aÒd Êiedи º ´½999µº


ÈÖÓceediÒg× Óf ACÅ E¹CÓÑÑeÖce ½999 cÓÒfeÖeÒceº