Approximate Constraint Satisfaction

Approximate Constraint Satisfaction Lars Engebretsen Stockholm 2000 Doctoral Dissertation Royal Institute of Technology Department of Numerical Analysis and Computer Science Akademisk avhandling som med tillst˚and av Kungl Tekniska Högskolan framlägges till offentlig granskning för avläggande av teknologie doktorsexamen tisdagen den 25 april 2000 kl 10.00 i Kollegiesalen, Administrationsbyggnaden, Kungl Tekniska Högskolan, Valhallavägen 79, Stockholm. ISBN 91-7170-545-7 TRITA-NA-0008 ISSN 0348-2952 ISRN KTH/NA/R--00/08--SE c Lars Engebretsen, April 2000 Högskoletryckeriet, Stockholm 2000 Abstract In this thesis we study optimization versions of NP-complete constraint satisfaction problems. An example of such a problem is the Maximum Satisfiability problem. An instance of this problem consists of clauses formed by Boolean variables and the goal is to find an assignment to the variables that satisfies as many clauses as possible. Since it is NP-complete to decide if all clauses are simultaneously satisfiable, the Maximum Satisfiability problem cannot be solved exactly in polynomial time unless P = NP. However, it may be possible to solve the problem approximately, in the sense that the number of satisfied clauses is at most some factor c from the optimum. Such an algorithm is called a c-approximation algorithm. The foundation of the results presented in this thesis is the approximability of several constraint satisfaction problems. We provide both upper and lower bounds on the approximability. A proof of an upper bound is usually a polynomial time c-approximation algorithm for some c, while a proof of a lower bound usually shows that it is NP- hard to approximate the problem within some c. We also use hardness results for constraint satisfaction problems to prove hardness results for other optimization problems. As for upper bounds, we use a combination of semidefinite programming and randomized rounding to construct a randomized 1.380-approximation algorithm for the Set Splitting and Not-All-Equal Satisfiability problems and a randomized (p−Θ(p−12))-approximation algorithm for systems of linear equations mod p with at most two unknowns in each equation. Using randomized sampling, we construct a randomized polynomial time approximation scheme for dense instances of arbitrary k-ary constraint satisfaction problems. With a combination of PCP techniques and representation theory for Abelian groups, we prove that it is NP-hard to approximate√ a k-ary constraint satisfaction problem over sets of cardinality D within Dk−2 k+1+1 − , for any constant >0. As a comparison, the best currently known algorithm approximates the problem within Dk−1. Using a reduction from systems of linear equations mod 2 with exactly three occurrences of each variable, we prove that it is NP-hard to approximate the Asym- metric Traveling Salesman Problem with distances one and two within 2805/2804− for every constant >0. For the special case where the distance function is con- strained to be symmetric, we prove a lower bound of 5381/5380− for every constant >0. Finally, we improve earlier reductions and combine the improved reduction with a recent PCP characterization of NP to prove that the size of a maximum clique in a graph√ with n vertices cannot be approximated in polynomial time within 3/2 n1−O(1/ log log n) unless NP ⊆ ZPTIME(2O(log n(log log n) )). ISBN 91-7170-545-7 • TRITA-NA-0008 • ISSN 0348-2952 • ISRN KTH/NA/R--00/08--SE iii iv Sammanfattning Denna doktorsavhandling – vars titel kan översättas med Approximativ lösning av villkorsproblem – behandlar optimeringsvarianter av olika typer av villkorsproblem. En instans av ett s˚adant problem är en mängd villkor över diskreta variabler och m˚alet är att konstruera en tilldelning till variablerna p˚aetts˚adant sätt att s˚am˚anga villkor som möjligt är uppfyllda. Ett exempel är när variablerna är booleska och villkoren är skrivna p˚a konjunktiv normalform. Villkoren kan d˚aseutp˚aföljande sätt: x ∨ y ∨ z, x ∨ y ∨ z, x ∨ y ∨ z, x ∨ y ∨ z, x ∨ y ∨ z. Eftersom problemet att avgöra om alla villkoren är satisfierbara samtidigt är NP- fullständigt är det osannolikt att det finns en algoritm som löser optimeringsva- rianten – att uppfylla s˚am˚anga villkor som möjligt – av problemet i polynomisk tid. I själva verket är ovanst˚aende, och m˚anga liknande, villkorsproblem lösbara i polynomisk tid endast om P = NP, vilket gör det intressant att undersöka om det är möjligt att lösa optimeringsproblemet approximativt i polynomisk tid. En approximativ lösning är en variabeltilldelning som uppfyller ˚atminstone en viss andel av det optimala antalet uppfyllda villkor. Inom detta omr˚ade är det möjligt att visa tv˚a typer av resultat. För det första att det g˚ar att approximera ett problem inom n˚agon viss faktor. Ett bevis för ett s˚adant resultat best˚ar i princip av en c-approximationsalgoritm – en algoritm som beräknar en lösning vars vikt är högst en faktor c fr˚an den optimala vikten. Ju lägre c desto bättre; om c =1löser algoritmen problemet exakt. Den andra typen av resultat är att det är sv˚art att approximera ett problem inom en viss faktor. Ett bevis för ett s˚adant resultat visar normalt att det är NP-sv˚art att approximera problemet inom n˚agot visst c. Avhandlingen best˚ar av tv˚a inledande kapitel, sex kapitel med redogörelser för viktiga tidigare resultat inom omr˚adet och sex kapitel med nya resultat. Inledning- en beskriver en tillämpning – att hitta det tidsoptimala sättet att borra de h˚al som behövs i de längsg˚aende balkarna i en lastbil. Därefter definieras de problem som behandlas i avhandlingen informellt och en redogörelse för avhandlingens uppbygg- nad ges. Det andra inledande kapitlet inneh˚aller formella definitioner av de problem och komplexitetsklasser som används i resten av avhandlingen. De sex bakgrundskapitlen tar upp tekniker som används för att visa de nya re- sultaten i avhandlingen. Kapitel 3 beskriver n˚agra sannolikhetsteoretiska begrepp: slumpalgoritmer och gränser för sannolikheten för händelser i sannolikhetsfördel- ningens svans. Den typiska tillämpningen av de senare gränserna är studier av en v vi Sammanfattning stokastisk variabel W som är en summa av indikatorvariabler. Händelsen vars san- nolikhet ska begränsas är d˚ap˚a formen {|W − E[W ]| >a} och det g˚ar att visa att sannolikheten för en s˚adan händelse i m˚anga fall avtar exponentiellt med växande a. Kapitel 4 beskriver hur approximationsalgoritmer kan konstrueras genom att kombinera linjära eller semidefinita relaxeringar med en slumpmässig avrundningsprocedur. Beviset för den resulterande approximationsalgoritmens kvalitet best˚ar av tv˚asteg:Först noteras att optimallösningen till en relaxering av ett maximerings- problem är ˚atminstone lika stor som ursprungsproblemets optimallösning. Därefter visas att avrundningssteget försämrar den relaxerade m˚alfunktionens värde med en faktor högst c. Slutsatsen blir att algoritmen är en c-approximationsalgoritm. I kapitel 5 beskrivs en teknik som används för att överföra approximationsresul- tat för ett visst problem till resultat för andra problem. Här används ett indirekt bevisförfarande: Vi antar att ett problem är lätt att approximera och visar att det medför att ett känt sv˚arapproximerbart problem ocks˚a är lätt att approximera. Slutsatsen av detta blir att det ursprungliga problemet inte kan vara lätt att approximera. Kapitel 6 beskriver hur man genom ett stickprovsförfarande kan konstruera approximationsalgoritmer för vissa typer av villkorsproblem. I kapitel 7 beskrivs hur funktioner fr˚an en ändlig abelsk grupp till de komplexa talen kan utvecklas i en fourierserie. I kapitel 8 beskrivs slutligen probabilistiskt verifierbara bevis –bevis vars korrekthet kan verifieras av en algoritm som endast tittar p˚a ett litet antal slumpmässigt valda positioner i beviset. I de sex avslutande kapitlen ges följande resultat: I kapitel 9 studerar vi problemet att givet en ändlig mängd S och ett antal delmängder av S dela upp S i tv˚adelarp˚aetts˚adant sätt att s˚am˚anga av de givna delmängderna som möjligt inneh˚aller element fr˚an b˚ada delarna. Genom att kombinera en semidefinit relaxering av problemet med en slumpmässig avrundningsprocedur konstruerar vi en 1,380-approximationsalgoritm. I kapitel 10 studerar vi problemet att satisfiera s˚am˚anga givna linjära ekvationer som möjligt. I det specialfall vi behandlar antar variablerna värden i Zp och varje ekvation inneh˚aller högst tv˚as˚adana variabler. Vi visar att det finns en algoritm som approximerar detta problem inom p − Θ(p−12) i polynomisk tid genom att utveckla ett nytt sätt att uttrycka problemet med en semidefinit relaxering. I kapitel 11 studerar vi problemet att givet en familj villkor, där varje villkor beror av högst k variabler som antar värden i en ändlig mängd G, satisfiera s˚a m˚anga villkor som m√öjligt. Vi visar att det är NP-sv˚art att approximera detta problem inom |G|k−2 k+1+1 − för varje >0. Beviset använder en kombination av fourierserieutvecklingar av funktioner fr˚an ändliga abelska grupper till de komplexa talen och en karakterisering av NP i termer av probabilistiskt verifierbara bevis. I kapitel 12 behandlar vi täta instanser – instanser som inneh˚aller Θ(nk) villkor, av ovanst˚aende problem.

Approximate Constraint Satisfaction

Approximability Preserving Reduction Giorgio Ausiello, Vangelis Paschos

Constraint Satisfaction Problems and Descriptive Complexity

Satisfiability-Based Algorithms for Haplotype Inference

Parameterizing MAX SNP Problems Above Guaranteed Values

Algorithms for Optimization Problems in Planar Graphs

Satisfiability on Mixed Instances

ON the COMPLEXITY of the SINGLE INDIVIDUAL SNP HAPLOTYPING PROBLEM 2 at That Site

Decidable Relationships Between Consistency Notions for Constraint Satisfaction Problems

Some Tight Results∗

On the Complexity of Constraint Satisfaction Problems a Model Theoretic Approach

Complexity, Combinatorial Positivity, and Newton Polytopes

1 Introduction