背包问题(Knapsack problem)是一种组合优化的NP完全问题。我们有n种物品,物品j的重量为wj,价格为pj。我们假定所有物品的重量和价格都是非负的。背包所能承受的最大重量为W。问题可以描述为:给定一组物品,每种物品都有自己的重量和价格,在限定的总重量内,我们如何选择,才能使得物品的总价格最高。问题的名称来源于如何选择最合适的物品放置于给定背包中。相似问题经常出现在商业、组合数学,计算复杂性理论、密码学和应用数学等领域中。也可以将背包问题描述为决定性问题,即在总重量不超过W的前提下,总价值是否能达到V?它是在1978年由Merkle和Hellman提出的。

背包问题已经研究了一个多世纪,早期的作品可追溯到1897年数学家托比亚斯·丹齐格(Tobias Dantzig,1884-1956)的早期作品,并指的是包装你最有价值或有用的物品而不会超载你的行李的常见问题。

中文名

背包问题

外文名

Knapsack Problem

应用领域

运筹学、应用数学、密码学等

提出者

Merkle-Hellman

应用

背包问题

1998年的石溪布鲁克大学算法库的研究表明,在75个算法问题中,背包问题是第18个最受欢迎,第4个最需要解决的问题(前三为后kd树,后缀树和bin包装问题)。

背包问题出现在各种领域的现实世界的决策过程中,例如寻找最少浪费的方式来削减原材料,选择投资和投资组合,选择资产支持资产证券化,和生成密钥为Merkle-Hellman和其他背包密码系统。

背包算法的一个早期应用是在测试的构建和评分中,测试者可以选择他们回答哪些问题。对于小例子来说,这是一个相当简单的过程,为测试者提供这样的选择。例如,如果考试包含12个问题,每个问题的价值为10分,测试者只需回答10个问题即可获得100分的最高分。然而,在点值的异质分布的测试 - 即不同的问题值得不同的点值 - 更难以提供选择。 Feuerman和Weiss提出了一个系统,其中学生被给予一个异质测试,共有125个可能的点。学生被要求尽可能回答所有的问题。在总点数加起来为100的问题的可能子集中,背包算法将确定哪个子集给每个学生最高的可能得分。

定义

我们有n种物品,物品j的重量为wj,价格为pj。

我们假定所有物品的重量和价格都是非负的。背包所能承受的最大重量为W。

如果限定每种物品只能选择0个或1个,则问题称为0-1背包问题。

可以用公式表示为:

最大化

受限于 

如果限定物品j最多只能选择bj个,则问题称为有界背包问题。

可以用公式表示为:

最大化

受限于

如果不限定每种物品的数量,则问题称为无界背包问题。

各类复杂的背包问题总可以变换为简单的0-1背包问题进行求解。

基础背包

题目

有N件物品和一个容量为V的背包。第i件物品的重量是w[i],价值是v[i]。求解将哪些物品装入背包可使这些物品的重量总和不超过背包容量,且价值总和最大。

基本思路

这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。

用子问题定义状态:即f[i][v]表示前i件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是:

f[i][v]=max{ f[i-1][v], f[i-1][v-w[i]]+v[i] }。

可以压缩空间,f[v]=max{f[v],f[v-w[i]]+v[i]}

这个方程非常重要,基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下:“将前i件物品放入容量为v的背包中”这个子问题,若只考虑第i件物品的策略(放或不放),那么就可以转化为一个只牵扯前i-1件物品的问题。如果不放第i件物品,那么问题就转化为“前i-1件物品放入容量为v的背包中”,价值为f[i-1][v];如果放第i件物品,那么问题就转化为“前i-1件物品放入剩下的容量为v-w[i]的背包中”,此时能获得的最大价值就是f [i-1][v-w[i]]再加上通过放入第i件物品获得的价值v[i]。

注意f[v]有意义当且仅当存在一个前i件物品的子集,其费用总和为f[v]。所以按照这个方程递推完毕后,最终的答案并不一定是f[N] [V],而是f[N][0..V]的最大值。如果将状态的定义中的“恰”字去掉,在转移方程中就要再加入一项f[v-1],这样就可以保证f[N] [V]就是最后的答案。至于为什么这样就可以,由你自己来体会了。

空间复杂

以上方法的时间和空间复杂度均为O(N*V),其中时间复杂度基本已经不能再优化了,但空间复杂度却可以优化到O(V)。

先考虑上面讲的基本思路如何实现,肯定是有一个主循环i=1..N,每次算出来二维数组f[i][0..V]的所有值。那么,如果只用一个数组f [0..V],能不能保证第i次循环结束后f[v]中表示的就是我们定义的状态f[i][v]呢?

f[i][v]是由f[i-1][v]和f [i-1][v-w[i]]两个子问题递推而来,能否保证在推f[v]时(也即在第i次主循环中推f[v]时)能够得到f[v]和f[v -w[i]]的值呢?事实上,这要求在每次主循环中我们以v=V..0的顺序推f[v],这样才能保证推f[v]时f[v-w[i]]保存的是状态f[i-1][v-c[i]]的值。伪代码如下:

for i=1..N

for v=V..0

f[v]=max{f[v],f[v-w[i]]+v[i]};

其中的f[v]=max{f[v],f[v-w[i]]}一句恰就相当于我们的转移方程f[i][v]=max{f[i-1][v],f[i-1][v-w[i]]},因为的

f[v-w[i]]就相当于原来的f[i-1][v-w[i]]。如果将v的循环顺序从上面的逆序改成顺序的话,那么则成了f[i][v]由f[i][v-w[i]]推知,与本题意不符,但它却是另一个重要的背包问题P02最简捷的解决方案,故学习只用一维数组解01背包问题是十分必要的。

示例程序

(完全背包问题求解)

  1. #include<iostream>
  2. using namespace std;
  3. int findM(int N,int K,int G[],int W[])
  4. {    int *M=new int[N+1],i,j,k;   
  5.       for(i=0;i<N+2;i++)
  6.           M[i]=0;
  7.       for(i=0;i<K;i++)
  8.       {        
  9.           for(j=N;j>=G[i];j--)
  10.                {            
  11.                    for(k=1;j-k*G[i]>=0;k++)
  12.                        {
  13.                           M[j]=M[j]>k*W[i]+M[j-k*G[i]]?M[j]:k*W[i]+M[j-k*G[i]];   
  14.                         }    
  15.                } 
  16.        }  
  17.            return M[N];
  18. }
  19. int main(){
  20.         int N,K,i;
  21.         while(cin>>N>>K)
  22.         {
  23.         int *G=new int[K];        
  24.         int *W=new int[K];        
  25.         for(i=0;i<K;i++)       
  26.         cin>>G[i]>>W[i];        
  27.         cout<<findM(N,K,G,W)<<endl;        
  28.         delete []G;       
  29.         delete []W;    
  30.         }    
  31.      return 0;
  32. }

递归实现

//现在设A[i][v]表示在剩余空间为v时选取当前物品i的最大值,B[i][v]表示不选取当前物品i的最大值,所以总的最大值必然是max(A[n][v],B[n][v]),详细程序见如下:

  1. #include<fstream>
  2. #include<iostream>
  3. using namespace std;
  4. #define MAXSIZE 1000
  5. int A[MAXSIZE+1][MAXSIZE+1],B[MAXSIZE+1][MAXSIZE+1];
  6. int c[MAXSIZE+1],w[MAXSIZE+1];
  7. int F(int n ,int v){
  8. if(n==0)return 0;
  9. if(!A[n][v]&&v>=c[n])
  10. A[n][v]=F(n-1,v-c[n])+w[n];
  11. if(!B[n][v])B[n][v]=F(n-1,v);
  12. return A[n][v]>B[n][v]?A[n][v]:B[n][v];
  13. }
  14. int main(int argc,char*argv[])
  15. {
  16. int n,v;
  17. memset(A,0,sizeof(A));
  18. memset(B,0,sizeof(B));
  19. ifstreamin("in.txt");
  20. ofstreamout("out.txt");
  21. cin>>n>>v;
  22. for(int i=1;i<=n;i++)
  23. cin>>c[i]>>w[i];
  24. cout<<F(n,v);
  25. return 0;
  26. }

程序

程序一:

  1. var
  2. i,j,v,n:longint;
  3. f,c,w:array[0..100] of longint;
  4. function max(a,b:longint):longint;
  5. begin
  6. if a>b then exit(a) else exit(b);
  7. end;
  8. begin
  9. read(n,v);
  10. fillchar(f,sizeof(f),0);
  11. for i:=1 to n do
  12. read(c[i],w[i]);
  13. for i:=1 to n do
  14. for j:=v downto c[i] do
  15. f[j]:=max(f[j],f[j-c[i]]+w[i]);
  16. writeln(f[v]);
  17. end.

程序二(顺推法):

  1. var m,n,x,i:integer;
  2. c,w:array[1..30] of integer;
  3. f:array[0..30,0..300] of integer;
  4. function max(x,y:integer):integer;
  5. begin
  6. if x>y then max:=x else max:=y;
  7. end;
  8. begin
  9. readln(n,m);
  10. for i:=1 to n do
  11. readln(c[i],w[i]);
  12. for i:=1 to n do
  13. for x:=1 to m do
  14. if x>=c[i] then f[i,x]:=max(f[i-1,x-c[i]]+w[i],f[i-1,x])
  15. else f[i,x]:=f[i-1,x];
  16. writeln(f[n,m]);
  17. end.

测试数据

//in.txt:

5 100

77 92

22 22

29 87

50 46

99 90

//out.txt

133

//in.txt:

8 200

79 83

58 14

86 54

11 79

28 72

62 52

15 48

68 62

//out.txt

334

C动态规划算法的实现(完整代码)

  1. #include<stdio.h>
  2. #include<malloc.h>
  3. typedefstruct
  4. {
  5. intobject;
  6. intweight;
  7. intvalue;
  8. }KnapSack;
  9. KnapSack*knapsack;//背包数组,用malloc或new动态创建
  10. intnum;//物体的个数
  11. intcontainer;//背包的最大容量
  12. int**array=NULL;//用来存放子问题的结果
  13. //动态创建背包
  14. voidCreate_KnapSack()
  15. {
  16. charc;
  17. printf("inputthenumberofobjects ");
  18. scanf("%d",&num);
  19. knapsack=newKnapSack[num+1];
  20. printf("inputweightandvalueof%dobjects,like1:410 ",num);
  21. for(inti=1;i<=num;i++)
  22. {
  23. scanf("%d%c%d%c%d",&knapsack[i].object,&c,&knapsack[i].weight,&c,&knapsack[i].value);
  24. getchar();//为了获取空格或其他输入,声明下scanf挺恶心
  25. }
  26. intk=knapsack[num].value;
  27. printf("%d",k);
  28. printf("inputthevolumeoftheknapsack: ");
  29. scanf("%d",&container);
  30. }
  31. //确定最优子问题
  32. voidResolve_KnapSack()
  33. {
  34. intk=knapsack[num].value;
  35. printf("%d",k);
  36. //创建动态二维数组m[num][container]
  37. array=(int**)malloc((num+1)*sizeof(int*));
  38. for(inti=0;i<=num;i++)
  39. array[i]=(int*)malloc((container+1)*sizeof(int));
  40. //
  41. for(intj=0;j<=container;j++)
  42. array[num][j]=(j>=knapsack[num].weight)?knapsack[num].value:0;
  43. //子问题的最优结果
  44. for(intm=num-1;m>0;m--)
  45. for(intn=0;n<=container;n++)
  46. if(n>knapsack[m].weight&&array[m+1][n]<=array[m+1][n-knapsack[m].weight]+knapsack[m].value)
  47. array[m][n]=array[m+1][n-knapsack[m].weight]+knapsack[m].value;
  48. //else包括两种情况,共同点是该物体没有被使用
  49. else
  50. array[m][n]=array[m+1][n];
  51. }
  52. //往回找,确定某个物体i是否被使用
  53. bool*Trace_back()
  54. {
  55. intc=container;
  56. bool*used;
  57. used=(bool*)malloc(sizeof(bool)*(num+1));
  58. for(inti=1;i<num;i++)
  59. if(array[i][c]==array[i+1][c])
  60. used[i]=0;
  61. else
  62. {
  63. used[i]=1;
  64. c-=knapsack[i].weight;
  65. }
  66. used[num]=(c>=knapsack[num].weight)?1:0;
  67. returnused;
  68. }
  69. //用来输出被使用的物体及其相关值
  70. voidPrint_KnapSack(bool*used)
  71. {
  72. printf("theobjectsusedasfollows: ");
  73. for(inti=1;i<=num;i++)
  74. if(used[i])
  75. printf("%d:%d%d ",knapsack[i].object,knapsack[i].weight,knapsack[i].value);
  76. }
  77. voidmain()
  78. {
  79. bool*used;
  80. Create_KnapSack();
  81. Resolve_KnapSack();
  82. used=Trace_back();
  83. Print_KnapSack(used);
  84. }

总结

0/1背包问题是最基本的背包问题,它包含了背包问题中设计状态、方程的最基本思想,另外,别的类型的背包问题往往也可以转换成0/1背包问题求解。故一定要仔细体会上面基本思路的得出方法,状态转移方程的意义,以及最后怎样优化的空间复杂度。

完全背包

题目

有N种物品和一个容量为V的背包,每种物品都有无限件可用。第i种物品的体积是c,价值是w。将哪些物品装入背包可使这些物品的体积总和不超过背包容量,且价值总和最大。

基本思路

这个问题非常类似于01背包问题,所不同的是每种物品有无限件。也就是从每种物品的角度考虑,与它相关的策略已并非取或不取两种,而是有取0件、取1件、取2件……等很多种。如果仍然按照解01背包时的思路,令f[i,v]表示前i种物品恰放入一个容量为v的背包的最大权值。仍然可以按照每种物品不同的策略写出状态转移方程,像这样:f[i,v]=max{f[i,v-vi]+wi,f[i-1,v]}。这跟01背包问题一样有O(N*V)个状态需要求解,但求解每个状态的时间则不是常数了,求解状态f[v]的时间是O(v/c),总的复杂度是超过O(VN)的。

将01背包问题的基本思路加以改进,得到了这样一个清晰的方法。这说明01背包问题的方程的确是很重要,可以推及其它类型的背包问题。但我们还是试图改进这个复杂度。

简单有效

完全背包问题有一个很简单有效的优化,是这样的:若两件物品i、j满足c<=c[j]且w>=w[j],则将物品j去掉,不用考虑。这个优化的正确性显然:任何情况下都可将价值小体积高的j换成物美价廉的i,得到至少不会更差的方案。对于随机生成的数据,这个方法往往会大大减少物品的件数,从而加快速度。然而这个并不能改善最坏情况的复杂度,因为有可能特别设计的数据可以一件物品也去不掉。

完全背包还有另一种优化,代码如下:

  1. var p,t:array[1..10000] of integer;
  2. m,n:integer;
  3. min:longint;
  4.  
  5. procedure init;
  6. var i:integer;
  7. begin
  8. readln(m,n);
  9. min:=maxlongint;
  10. for i:=1 to n do
  11. begin
  12. readln(p[i],t[i]);
  13. if t[i]<min then min:=t[i];
  14. end;
  15. end;
  16.  
  17. procedure qsort(l,r:integer);
  18. var i,j,x,temp:longint;
  19. begin
  20. i:=l;
  21. j:=r;
  22. x:=t[(l+r)div2];
  23. while i<jdo
  24. begin
  25. while(i<j)and(t[i]<x) do inc(i);
  26. while(i<j)and(x<t[j]) do dec(j);
  27. if i<=j then
  28. begin
  29. temp:=t[i];
  30. t[i]:=t[j];
  31. t[j]:=temp;
  32. temp:=p[i];
  33. p[i]:=p[j];
  34. p[j]:=temp;
  35. inc(i);
  36. dec(j);
  37. end;
  38. end;
  39. if i<r then qsort(i,r);
  40. if l<j then qsort(l,j);
  41. end;
  42.  
  43. function max(a,b:longint):longint;
  44. begin
  45. if a>b then max:=a else max:=b;
  46. end;
  47.  
  48. procedure work;
  49. var f:array[0..10000] of longint;
  50. i,j:longint;
  51. begin
  52. fillchar(f,sizeof(f),0);
  53. for i:=min to m do
  54. begin
  55. f[i]:=f[i-1];
  56. for j:=1 to n do
  57. if i-t[j]>=0 then f[i]:=max(f[i],f[i-t[j]]+p[j]) else break;
  58. end;
  59. writeln(f[m]);
  60. end;
  61.  
  62. begin
  63. init;
  64. qsort(1,n);
  65. work;
  66. end.

转为问题

既然01背包问题是最基本的背包问题,那么我们可以考虑把完全背包问题转化为01背包问题来解。最简单的想法是,考虑到第i种物品最多选V/c 件,于是可以把第i种物品转化为V/c件体积及价值均不变的物品,然后求解这个01背包问题。这样完全没有改进基本思路的时间复杂度,但这毕竟给了我们将完全背包问题转化为01背包问题的思路:将一种物品拆成多件物品。

更高效的转化方法是:把第i种物品拆成体积为c*2^k、价值为w*2^k的若干件物品,其中k满足c*2^k<V。这是二进制的思想,因为不管最优策略选几件第i种物品,总可以表示成若干个2^k件物品的和。这样把每种物品拆成O(log(V/c))件物品,是一个很大的改进。但我们有更优的O(VN)的算法。* O(VN)的算法 这个算法使用一维数组,先看伪代码:<pre class"example"> for i=1..N for v=0..V f[v]=max{f[v],f[v-c]+w};

你会发现,这个伪代码与P01的伪代码只有v的循环次序不同而已。为什么这样一改就可行呢?首先想想为什么P01中要按照v=V..0的逆序来循环。这是因为要保证第i次循环中的状态f[v]是由状态f[v-c]递推而来。换句话说,这正是为了保证每件物品只选一次,保证在考虑“选入第i件物品”这件策略时,依据的是一个绝无已经选入第i件物品的子结果f[v-c]。而完全背包的特点恰是每种物品可选无限件,所以在考虑“加选一件第i种物品”这种策略时,却正需要一个可能已选入第i种物品的子结果f[v-c],所以就可以并且必须采用v= 0..V的顺序循环。这就是这个简单的程序为何成立的道理。

这个算法也可以以另外的思路得出。例如,基本思路中的状态转移方程可以等价地变形成这种形式:f[v]=max{f[v],f[v-c]+w},将这个方程用一维数组实现,便得到了上面的伪代码。

实现

  1. var
  2. i,j,v,n:longint;
  3. f,c,w:array[0..100] of longint;
  4. functionmax(a,b:longint):longint;
  5. begin
  6. ifa>bthenexit(a)elseexit(b);
  7. end;
  8. begin
  9. read(n,v);
  10. fillchar(f,sizeof(f),0);
  11. fori:=1tondo
  12. read(c[i],w[i]);
  13. fori:=1tondo
  14. forj:=c[i]tovdo
  15. f[j]:=max(f[j],f[j-c[i]]+w[i]);
  16. writeln(f[v]);
  17. end.

总结

完全背包问题也是一个相当基础的背包问题,它有两个状态转移方程,分别在“基本思路”以及“O(VN)的算法“的小节中给出。希望你能够对这两个状态转移方程都仔细地体会,不仅记住,也要弄明白它们是怎么得出来的,最好能够自己想一种得到这些方程的方法。事实上,对每一道动态规划题目都思考其方程的意义以及如何得来,是加深对动态规划的理解、提高动态规划功力的好方法。

多重问题

题目

有N种物品和一个容量为V的背包。第i种物品最多有n件可用,每件体积是c,价值是w。求解将哪些物品装入背包可使这些物品的体积总和不超过背包容量,且价值总和最大。

基本算法

这题目和完全背包问题很类似。基本的方程只需将完全背包问题的方程略微一改即可,因为对于第i种物品有n+1种策略:取0件,取1件……取 n件。令f[v]表示前i种物品恰放入一个容量为v的背包的最大权值,则:f[v]=max{f[v-k*c]+ k*w|0<=k<=n}。复杂度是O(V*∑n)。

转为问题

另一种好想好写的基该方法是转化为01背包求解:把第i种物品换成n件01背包中的物品,则得到了物品数为∑n的01背包问题,直接求解,复杂度仍然是O(V*∑n)。

但是我们期望将它转化为01背包问题之后能够像完全背包一样降低复杂度。仍然考虑二进制的思想,我们考虑把第i种物品换成若干件物品,使得原问题中第i种物品可取的每种策略——取0..n件——均能等价于取若干件代换以后的物品。另外,取超过n件的策略必不能出现。

方法是:将第i种物品分成若干件物品,其中每件物品有一个系数,这件物品的费用和价值均是原来的费用和价值乘以这个系数。使这些系数分别为 1,2,4,...,2^(k-1),n-2^k+1,且k是满足n-2^k+1>0的最大整数。例如,如果n为13,就将这种物品分成系数分别为1,2,4,6的四件物品。

分成的这几件物品的系数和为n,表明不可能取多于n件的第i种物品。另外这种方法也能保证对于0..n间的每一个整数,均可以用若干个系数的和表示,这个证明可以分0..2^k-1和2^k..n两段来分别讨论得出,并不难,希望你自己思考尝试一下。

这样就将第i种物品分成了O(log n)种物品,将原问题转化为了复杂度为O(V*∑log n)的01背包问题,是很大的改进。

算法

多重背包问题同样有O(VN)的算法。这个算法基于基本算法的状态转移方程,但应用单调队列的方法使每个状态的值可以以均摊O⑴的时间求解。由于用单调队列优化的DP已超出了NOIP的范围,故本文不再展开讲解。我最初了解到这个方法是在楼天成的“男人八题”幻灯片上。

小结

这里我们看到了将一个算法的复杂度由O(V*∑n)改进到O(V*∑log n)的过程,还知道了存在应用超出NOIP范围的知识的O(VN)算法。希望你特别注意“拆分物品”的思想和方法,自己证明一下它的正确性,并用尽量简洁的程序来实现。

三种背包

问题

如果将P01、P02、P03混合起来。也就是说,有的物品只可以取一次(01背包),有的物品可以取无限次(完全背包),有的物品可以取的次数有一个上限(多重背包)。应该怎么求解呢?

背包混合

考虑到在P01和P02中最后给出的伪代码只有一处不同,故如果只有两类物品:一类物品只能取一次,另一类物品可以取无限次,那么只需在对每个物品应用转移方程时,根据物品的类别选用顺序或逆序的循环即可,复杂度是O(VN)。伪代码如下:

for i=1..N

if 第i件物品是01背包

for v=V..0

f[v]=max{f[v],f[v-c]+w};

else if 第i件物品是完全背包

for v=0..V

f[v]=max{f[v],f[v-c]+w};

再加上多重背包

如果再加上有的物品最多可以取有限次,那么原则上也可以给出O(VN)的解法:遇到多重背包类型的物品用单调队列解即可。但如果不考虑超过NOIP范围的算法的话,用P03中将每个这类物品分成O(log n)个01背包的物品的方法也已经很优了。

小结

有人说,困难的题目都是由简单的题目叠加而来的。这句话是否公理暂且存之不论,但它在本讲中已经得到了充分的体现。本来01背包、完全背包、多重背包都不是什么难题,但将它们简单地组合起来以后就得到了这样一道一定能吓倒不少人的题目。但只要基础扎实,领会三种基本背包问题的思想,就可以做到把困难的题目拆分成简单的题目来解决。

二维费用

问题

二维费用的背包问题是指:对于每件物品,具有两种不同的费用;选择这件物品必须同时付出这两种代价;对于每种代价都有一个可付出的最大值(背包容量)。问怎样选择物品可以得到最大的价值。设这两种代价分别为代价1和代价2,第i件物品所需的两种代价分别为a和b。两种代价可付出的最大值(两种背包容量)分别为V和U。物品的价值为w。

算法

费用加了一维,只需状态也加一维即可。设f[v]表示前i件物品付出两种代价分别为v和u时可获得的最大价值。状态转移方程就是:fi[i][v][u]=max{f[i-1][v][u],f[i-1][v-a[i]][u-b[i]]+w[i]}。如前述方法,可以只使用二维的数组:当每件物品只可以取一次时变量v和u采用逆序的循环,当物品有如完全背包问题时采用顺序的循环。当物品有如多重背包问题时拆分物品。

限制

有时,“二维费用”的条件是以这样一种隐含的方式给出的:最多只能取M件物品。这事实上相当于每件物品多了一种“件数”的费用,每个物品的件数费用均为1,可以付出的最大件数费用为M。换句话说,设f[v][m]表示付出费用v、最多选m件时可得到的最大价值,则根据物品的类型(01、完全、多重)用不同的方法循环更新,最后在f[0..V][0..M]范围内寻找答案。

另外,如果要求“恰取M件物品”,则在f[0..V][M]范围内寻找答案。

小结

事实上,当发现由熟悉的动态规划题目变形得来的题目时,在原来的状态中加一维以满足新的限制是一种比较通用的方法。希望你能从本讲中初步体会到这种方法。

分组背包

问题

有N件物品和一个容量为V的背包。第i件物品的费用是c,价值是w。这些物品被划分为若干组,每组中的物品互相冲突,最多选一件。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。

算法

这个问题变成了每组物品有若干种策略:是选择本组的某一件,还是一件都不选。也就是说设f[k][v]表示前k组物品花费费用v能取得的最大权值,则有f[k][v]=max{f[k-1][v],f[k-1][v-c]+w|物品i属于第k组}。

使用一维数组的伪代码如下:

for 所有的组k

for v=V..0

for 所有的i属于组k (我觉得循环顺序应改成这样,大家可以看一下以前的版本自己判断)

f[v]=max{f[v],f[v-c]+w}

另外,显然可以对每组中的物品应用P02中“一个简单有效的优化”。

小结

分组的背包问题将彼此互斥的若干物品称为一个组,这建立了一个很好的模型。不少背包问题的变形都可以转化为分组的背包问题(例如P07),由分组的背包问题进一步可定义“泛化物品”的概念,十分有利于解题。

依赖问题

简化问题

这种背包问题的物品间存在某种“依赖”的关系。也就是说,i依赖于j,表示若选物品i,则必须选物品j。为了简化起见,我们先设没有某个物品既依赖于别的物品,又被别的物品所依赖;另外,没有某件物品同时依赖多件物品。

算法

这个问题由NOIP2006金明的预算方案一题扩展而来。遵从该题的提法,将不依赖于别的物品的物品称为“主件”,依赖于某主件的物品称为“附件”。由这个问题的简化条件可知所有的物品由若干主件和依赖于每个主件的一个附件集合组成。

按照背包问题的一般思路,仅考虑一个主件和它的附件集合。可是,可用的策略非常多,包括:一个也不选,仅选择主件,选择主件后再选择一个附件,选择主件后再选择两个附件……无法用状态转移方程来表示如此多的策略。(事实上,设有n个附件,则策略有2^n+1个,为指数级。)

考虑到所有这些策略都是互斥的(也就是说,你只能选择一种策略),所以一个主件和它的附件集合实际上对应于P06中的一个物品组,每个选择了主件又选择了若干个附件的策略对应于这个物品组中的一个物品,其费用和价值都是这个策略中的物品的值的和。但仅仅是这一步转化并不能给出一个好的算法,因为物品组中的物品还是像原问题的策略一样多。

再考虑P06中的一句话:可以对每组中的物品应用P02中“一个简单有效的优化”。这提示我们,对于一个物品组中的物品,所有费用相同的物品只留一个价值最大的,不影响结果。所以,我们可以对主件i的“附件集合”先进行一次01背包,得到费用依次为0..V-c所有这些值时相应的最大价值f'[0..V-c]。那么这个主件及它的附件集合相当于V-c+1个物品的物品组,其中费用为c+k的物品的价值为f'[k]+w。也就是说原来指数级的策略中有很多策略都是冗余的,通过一次01背包后,将主件i转化为 V-c+1个物品的物品组,就可以直接应用P06的算法解决问题了。

一般问题

更一般的问题是:依赖关系以图论中“森林”的形式给出(森林即多叉树的集合),也就是说,主件的附件仍然可以具有自己的附件集合,限制只是每个物品最多只依赖于一个物品(只有一个主件)且不出现循环依赖。

解决这个问题仍然可以用将每个主件及其附件集合转化为物品组的方式。唯一不同的是,由于附件可能还有附件,就不能将每个附件都看作一个一般的01 背包中的物品了。若这个附件也有附件集合,则它必定要被先转化为物品组,然后用分组的背包问题解出主件及其附件集合所对应的附件组中各个费用的附件所对应的价值。

事实上,这是一种树形DP,其特点是每个父节点都需要对它的各个儿子的属性进行一次DP以求得自己的相关属性。这已经触及到了“泛化物品”的思想。看完P08后,你会发现这个“依赖关系树”每一个子树都等价于一件泛化物品,求某节点为根的子树对应的泛化物品相当于求其所有儿子的对应的泛化物品之和。

小结

NOIP2006的那道背包问题我做得很失败,写了上百行的代码,却一分未得。后来我通过思考发现通过引入“物品组”和“依赖”的概念可以加深对这题的理解,还可以解决它的推广问题。用物品组的思想考虑那题中极其特殊的依赖关系:物品不能既作主件又作附件,每个主件最多有两个附件,可以发现一个主件和它的两个附件等价于一个由四个物品组成的物品组,这便揭示了问题的某种本质。

我想说:失败不是什么丢人的事情,从失败中全无收获才是。

泛化物品

定义

考虑这样一种物品,它并没有固定的费用和价值,而是它的价值随着你分配给它的费用而变化。这就是泛化物品的概念。

更严格的定义之。在背包容量为V的背包问题中,泛化物品是一个定义域为0..V中的整数的函数h,当分配给它的费用为v时,能得到的价值就是h(v)。

这个定义有一点点抽象,另一种理解是一个泛化物品就是一个数组h[0..V],给它费用v,可得到价值h[V]。

一个费用为c价值为w的物品,如果它是01背包中的物品,那么把它看成泛化物品,它就是除了h(c)=w其它函数值都为0的一个函数。如果它是完全背包中的物品,那么它可以看成这样一个函数,仅当v被c整除时有h(v)=v/c*w,其它函数值均为0。如果它是多重背包中重复次数最多为n的物品,那么它对应的泛化物品的函数有h(v)=v/c*w仅当v被c整除且v/c<=n,其它情况函数值均为0。

一个物品组可以看作一个泛化物品h。对于一个0..V中的v,若物品组中不存在费用为v的的物品,则h(v)=0,否则h(v)为所有费用为v的物品的最大价值。P07中每个主件及其附件集合等价于一个物品组,自然也可看作一个泛化物品。

泛化物品

如果面对两个泛化物品h和l,要用给定的费用从这两个泛化物品中得到最大的价值,怎么求呢?事实上,对于一个给定的费用v,只需枚举将这个费用如何分配给两个泛化物品就可以了。同样的,对于0..V的每一个整数v,可以求得费用v分配到h和l中的最大价值f(v)。也即f(v)=max{h(k) +l(v-k)|0<=k<=v}。可以看到,f也是一个由泛化物品h和l决定的定义域为0..V的函数,也就是说,f是一个由泛化物品h和 l决定的泛化物品。

由此可以定义泛化物品的和:h、l都是泛化物品,若泛化物品f满足f(v)=max{h(k)+l(v-k)|0<=k<=v},则称f是h与l的和,即f=h+l。这个运算的时间复杂度是O(V^2)。

泛化物品的定义表明:在一个背包问题中,若将两个泛化物品代以它们的和,不影响问题的答案。事实上,对于其中的物品都是泛化物品的背包问题,求它的答案的过程也就是求所有这些泛化物品之和的过程。设此和为s,则答案就是s[0..V]中的最大值。

问题泛化

一个背包问题中,可能会给出很多条件,包括每种物品的费用、价值等属性,物品之间的分组、依赖等关系等。但肯定能将问题对应于某个泛化物品。也就是说,给定了所有条件以后,就可以对每个非负整数v求得:若背包容量为v,将物品装入背包可得到的最大价值是多少,这可以认为是定义在非负整数集上的一件泛化物品。这个泛化物品——或者说问题所对应的一个定义域为非负整数的函数——包含了关于问题本身的高度浓缩的信息。一般而言,求得这个泛化物品的一个子域(例如0..V)的值之后,就可以根据这个函数的取值得到背包问题的最终答案。

综上所述,一般而言,求解背包问题,即求解这个问题所对应的一个函数,即该问题的泛化物品。而求解某个泛化物品的一种方法就是将它表示为若干泛化物品的和然后求之。

小结

本讲可以说都是我自己的原创思想。具体来说,是我在学习函数式编程的 Scheme 语言时,用函数编程的眼光审视各类背包问题得出的理论。这一讲真的很抽象,也许在“模型的抽象程度”这一方面已经超出了NOIP的要求,所以暂且看不懂也没关系。相信随着你的OI之路逐渐延伸,有一天你会理解的。

我想说:“思考”是一个OIer最重要的品质。简单的问题,深入思考以后,也能发现更多。

问法变化

以上涉及的各种背包问题都是要求在背包容量(费用)的限制下求可以取到的最大价值,但背包问题还有很多种灵活的问法。

例如,求解最多可以放多少件物品或者最多可以装满多少背包的空间。这都可以根据具体问题利用前面的方程求出所有状态的值(f数组)之后得到。

还有,如果要求的是“总价值最小”“总件数最小”,只需简单的将上面的状态转移方程中的max改成min即可。

下面说一些变化更大的问法。

输出方案

一般而言,背包问题是要求一个最优值,如果要求输出这个最优值的方案,可以参照一般动态规划问题输出方案的方法:记录下每个状态的最优值是由状态转移方程的哪一项推出来的,换句话说,记录下它是由哪一个策略推出来的。便可根据这条策略找到上一个状态,从上一个状态接着向前推即可。

还是以01背包为例,方程为f[v]=max{f[v],f[v-c]+w}。再用一个数组g [v],设g[v]=0表示推出f[v]的值时是采用了方程的前一项(也即f[v]=f[v]),g[v]表示采用了方程的后一项。注意这两项分别表示了两种策略:未选第i个物品及选了第i个物品。那么输出方案的伪代码可以这样写(设最终状态为f[N][V]):

i=N

v=V

while(i>0)

if(g[v]==0)

print "未选第i项物品"

else if(g[v]==1)

print "选了第i项物品"

v=v-c

另外,采用方程的前一项或后一项也可以在输出方案的过程中根据f[v]的值实时地求出来,也即不须纪录g数组,将上述代码中的g [v]==0改成f[v]==f[v],g[v]==1改成f[v]==f[v-c]+w也可。

输出字典序最小的最优方案

这里“字典序最小”的意思是1..N号物品的选择方案排列出来以后字典序最小。以输出01背包最小字典序的方案为例。

一般而言,求一个字典序最小的最优方案,只需要在转移时注意策略。首先,子问题的定义要略改一些。我们注意到,如果存在一个选了物品1的最优方案,那么答案一定包含物品1,原问题转化为一个背包容量为v-c[1],物品为2..N的子问题。反之,如果答案不包含物品1,则转化成背包容量仍为V,物品为2..N的子问题。不管答案怎样,子问题的物品都是以i..N而非前所述的1..i的形式来定义的,所以状态的定义和转移方程都需要改一下。但也许更简易的方法是先把物品逆序排列一下,以下按物品已被逆序排列来叙述。

在这种情况下,可以按照前面经典的状态转移方程来求值,只是输出方案的时候要注意:从N到1输入时,如果f[v]==f及f[v]==f[f-c]+w同时成立,应该按照后者(即选择了物品i)来输出方案。

求方案总

对于一个给定了背包容量、物品费用、物品间相互关系(分组、依赖等)的背包问题,除了再给定每个物品的价值后求可得到的最大价值外,还可以得到装满背包或将背包装至某一指定容量的方案总数。

对于这类改变问法的问题,一般只需将状态转移方程中的max改成sum即可。例如若每件物品均是01背包中的物品,转移方程即为f[v]=sum{f[v],f[v-c]+w},初始条件f[0][0]=1。

事实上,这样做可行的原因在于状态转移方程已经考察了所有可能的背包组成方案。

最优方案

这里的最优方案是指物品总价值最大的方案。还是以01背包为例。

结合求最大总价值和方案总数两个问题的思路,最优方案的总数可以这样求:f[v]意义同前述,g[v]表示这个子问题的最优方案的总数,则在求f[v]的同时求g[v]的伪代码如下:

for i=1..N

for v=0..V

f[v]=max{f[v],f[v-c]+w}

g[v]=0

if(f[v]==f[v])

inc(g[v],g[v]

if(f[v]==f[v-c]+w)

inc(g[v],g[v-c])

如果你是第一次看到这样的问题,请仔细体会上面的伪代码。

小结

显然,这里不可能穷尽背包类动态规划问题所有的问法。甚至还存在一类将背包类动态规划问题与其它领域(例如数论、图论)结合起来的问题,在这篇论背包问题的专文中也不会论及。但只要深刻领会前述所有类别的背包问题的思路和状态转移方程,遇到其它的变形问法,只要题目难度还属于NOIP,应该也不难想出算法。

触类旁通、举一反三,应该也是一个OIer应有的品质吧。