drivers/staging/ramzswap/ramzswap_drv.c

   1 /*
   2  * Compressed RAM based swap device
   3  *
   4  * Copyright (C) 2008, 2009  Nitin Gupta
   5  *
   6  * This code is released using a dual license strategy: BSD/GPL
   7  * You can choose the licence that better fits your requirements.
   8  *
   9  * Released under the terms of 3-clause BSD License
  10  * Released under the terms of GNU General Public License Version 2.0
  11  *
  12  * Project home: http://compcache.googlecode.com
  13  */
  14
  15 #define KMSG_COMPONENT "ramzswap"
  16 #define pr_fmt(fmt) KMSG_COMPONENT ": " fmt
  17
  18 #include <linux/module.h>
  19 #include <linux/kernel.h>
  20 #include <linux/bitops.h>
  21 #include <linux/blkdev.h>
  22 #include <linux/buffer_head.h>
  23 #include <linux/device.h>
  24 #include <linux/genhd.h>
  25 #include <linux/highmem.h>
  26 #include <linux/lzo.h>
  27 #include <linux/mutex.h>
  28 #include <linux/string.h>
  29 #include <linux/swap.h>
  30 #include <linux/swapops.h>
  31 #include <linux/vmalloc.h>
  32 #include <linux/version.h>
  33
  34 #include "ramzswap_drv.h"
  35
  36 /* Globals */
  37 static int ramzswap_major;
  38 static struct ramzswap *devices;
  39
  40 /*
  41  * Pages that compress to larger than this size are
  42  * forwarded to backing swap, if present or stored
  43  * uncompressed in memory otherwise.
  44  */
  45 static unsigned int max_zpage_size;
  46
  47 /* Module params (documentation at end) */
  48 static unsigned int num_devices;
  49
  50 static int rzs_test_flag(struct ramzswap *rzs, u32 index,
  51                         enum rzs_pageflags flag)
  52 {
  53         return rzs->table[index].flags & BIT(flag);
  54 }
  55
  56 static void rzs_set_flag(struct ramzswap *rzs, u32 index,
  57                         enum rzs_pageflags flag)
  58 {
  59         rzs->table[index].flags |= BIT(flag);
  60 }
  61
  62 static void rzs_clear_flag(struct ramzswap *rzs, u32 index,
  63                         enum rzs_pageflags flag)
  64 {
  65         rzs->table[index].flags &= ~BIT(flag);
  66 }
  67
  68 static int page_zero_filled(void *ptr)
  69 {
  70         unsigned int pos;
  71         unsigned long *page;
  72
  73         page = (unsigned long *)ptr;
  74
  75         for (pos = 0; pos != PAGE_SIZE / sizeof(*page); pos++) {
  76                 if (page[pos])
  77                         return 0;
  78         }
  79
  80         return 1;
  81 }
  82
  83 /*
  84  * memlimit cannot be greater than backing disk size.
  85  */
  86 static void ramzswap_set_memlimit(struct ramzswap *rzs, size_t totalram_bytes)
  87 {
  88         int memlimit_valid = 1;
  89
  90         if (!rzs->memlimit) {
  91                 pr_info("Memory limit not set.\n");
  92                 memlimit_valid = 0;
  93         }
  94
  95         if (rzs->memlimit > rzs->disksize) {
  96                 pr_info("Memory limit cannot be greater than "
  97                         "disksize: limit=%zu, disksize=%zu\n",
  98                         rzs->memlimit, rzs->disksize);
  99                 memlimit_valid = 0;
 100         }
 101
 102         if (!memlimit_valid) {
 103                 size_t mempart, disksize;
 104                 pr_info("Using default: smaller of (%u%% of RAM) and "
 105                         "(backing disk size).\n",
 106                         default_memlimit_perc_ram);
 107                 mempart = default_memlimit_perc_ram * (totalram_bytes / 100);
 108                 disksize = rzs->disksize;
 109                 rzs->memlimit = mempart > disksize ? disksize : mempart;
 110         }
 111
 112         if (rzs->memlimit > totalram_bytes / 2) {
 113                 pr_info(
 114                 "Its not advisable setting limit more than half of "
 115                 "size of memory since we expect a 2:1 compression ratio. "
 116                 "Limit represents amount of *compressed* data we can keep "
 117                 "in memory!\n"
 118                 "\tMemory Size: %zu kB\n"
 119                 "\tLimit you selected: %zu kB\n"
 120                 "Continuing anyway ...\n",
 121                 totalram_bytes >> 10, rzs->memlimit >> 10
 122                 );
 123         }
 124
 125         rzs->memlimit &= PAGE_MASK;
 126         BUG_ON(!rzs->memlimit);
 127 }
 128
 129 static void ramzswap_set_disksize(struct ramzswap *rzs, size_t totalram_bytes)
 130 {
 131         if (!rzs->disksize) {
 132                 pr_info(
 133                 "disk size not provided. You can use disksize_kb module "
 134                 "param to specify size.\nUsing default: (%u%% of RAM).\n",
 135                 default_disksize_perc_ram
 136                 );
 137                 rzs->disksize = default_disksize_perc_ram *
 138                                         (totalram_bytes / 100);
 139         }
 140
 141         if (rzs->disksize > 2 * (totalram_bytes)) {
 142                 pr_info(
 143                 "There is little point creating a ramzswap of greater than "
 144                 "twice the size of memory since we expect a 2:1 compression "
 145                 "ratio. Note that ramzswap uses about 0.1%% of the size of "
 146                 "the swap device when not in use so a huge ramzswap is "
 147                 "wasteful.\n"
 148                 "\tMemory Size: %zu kB\n"
 149                 "\tSize you selected: %zu kB\n"
 150                 "Continuing anyway ...\n",
 151                 totalram_bytes >> 10, rzs->disksize
 152                 );
 153         }
 154
 155         rzs->disksize &= PAGE_MASK;
 156 }
 157
 158 /*
 159  * Swap header (1st page of swap device) contains information
 160  * to indentify it as a swap partition. Prepare such a header
 161  * for ramzswap device (ramzswap0) so that swapon can identify
 162  * it as swap partition. In case backing swap device is provided,
 163  * copy its swap header.
 164  */
 165 static int setup_swap_header(struct ramzswap *rzs, union swap_header *s)
 166 {
 167         int ret = 0;
 168         struct page *page;
 169         struct address_space *mapping;
 170         union swap_header *backing_swap_header;
 171
 172         /*
 173          * There is no backing swap device. Create a swap header
 174          * that is acceptable by swapon.
 175          */
 176         if (!rzs->backing_swap) {
 177                 s->info.version = 1;
 178                 s->info.last_page = (rzs->disksize >> PAGE_SHIFT) - 1;
 179                 s->info.nr_badpages = 0;
 180                 memcpy(s->magic.magic, "SWAPSPACE2", 10);
 181                 return 0;
 182         }
 183
 184         /*
 185          * We have a backing swap device. Copy its swap header
 186          * to ramzswap device header. If this header contains
 187          * invalid information (backing device not a swap
 188          * partition, etc.), swapon will fail for ramzswap
 189          * which is correct behavior - we don't want to swap
 190          * over filesystem partition!
 191          */
 192
 193         /* Read the backing swap header (code from sys_swapon) */
 194         mapping = rzs->swap_file->f_mapping;
 195         if (!mapping->a_ops->readpage) {
 196                 ret = -EINVAL;
 197                 goto out;
 198         }
 199
 200         page = read_mapping_page(mapping, 0, rzs->swap_file);
 201         if (IS_ERR(page)) {
 202                 ret = PTR_ERR(page);
 203                 goto out;
 204         }
 205
 206         backing_swap_header = kmap(page);
 207         memcpy(s, backing_swap_header, sizeof(*s));
 208         if (s->info.nr_badpages) {
 209                 pr_info("Cannot use backing swap with bad pages (%u)\n",
 210                         s->info.nr_badpages);
 211                 ret = -EINVAL;
 212         }
 213         /*
 214          * ramzswap disksize equals number of usable pages in backing
 215          * swap. Set last_page in swap header to match this disksize
 216          * ('last_page' means 0-based index of last usable swap page).
 217          */
 218         s->info.last_page = (rzs->disksize >> PAGE_SHIFT) - 1;
 219         kunmap(page);
 220
 221 out:
 222         return ret;
 223 }
 224
 225 void ramzswap_ioctl_get_stats(struct ramzswap *rzs,
 226                         struct ramzswap_ioctl_stats *s)
 227 {
 228         strncpy(s->backing_swap_name, rzs->backing_swap_name,
 229                 MAX_SWAP_NAME_LEN - 1);
 230         s->backing_swap_name[MAX_SWAP_NAME_LEN - 1] = '\0';
 231
 232         s->disksize = rzs->disksize;
 233         s->memlimit = rzs->memlimit;
 234
 235 #if defined(CONFIG_RAMZSWAP_STATS)
 236         {
 237         struct ramzswap_stats *rs = &rzs->stats;
 238         size_t succ_writes, mem_used;
 239         unsigned int good_compress_perc = 0, no_compress_perc = 0;
 240
 241         mem_used = xv_get_total_size_bytes(rzs->mem_pool)
 242                         + (rs->pages_expand << PAGE_SHIFT);
 243         succ_writes = rs->num_writes - rs->failed_writes;
 244
 245         if (succ_writes && rs->pages_stored) {
 246                 good_compress_perc = rs->good_compress * 100
 247                                         / rs->pages_stored;
 248                 no_compress_perc = rs->pages_expand * 100
 249                                         / rs->pages_stored;
 250         }
 251
 252         s->num_reads = rs->num_reads;
 253         s->num_writes = rs->num_writes;
 254         s->failed_reads = rs->failed_reads;
 255         s->failed_writes = rs->failed_writes;
 256         s->invalid_io = rs->invalid_io;
 257         s->pages_zero = rs->pages_zero;
 258
 259         s->good_compress_pct = good_compress_perc;
 260         s->pages_expand_pct = no_compress_perc;
 261
 262         s->pages_stored = rs->pages_stored;
 263         s->pages_used = mem_used >> PAGE_SHIFT;
 264         s->orig_data_size = rs->pages_stored << PAGE_SHIFT;
 265         s->compr_data_size = rs->compr_size;
 266         s->mem_used_total = mem_used;
 267
 268         s->bdev_num_reads = rs->bdev_num_reads;
 269         s->bdev_num_writes = rs->bdev_num_writes;
 270         }
 271 #endif /* CONFIG_RAMZSWAP_STATS */
 272 }
 273
 274 static int add_backing_swap_extent(struct ramzswap *rzs,
 275                                 pgoff_t phy_pagenum,
 276                                 pgoff_t num_pages)
 277 {
 278         unsigned int idx;
 279         struct list_head *head;
 280         struct page *curr_page, *new_page;
 281         unsigned int extents_per_page = PAGE_SIZE /
 282                                 sizeof(struct ramzswap_backing_extent);
 283
 284         idx = rzs->num_extents % extents_per_page;
 285         if (!idx) {
 286                 new_page = alloc_page(__GFP_ZERO);
 287                 if (!new_page)
 288                         return -ENOMEM;
 289
 290                 if (rzs->num_extents) {
 291                         curr_page = virt_to_page(rzs->curr_extent);
 292                         head = &curr_page->lru;
 293                 } else {
 294                         head = &rzs->backing_swap_extent_list;
 295                 }
 296
 297                 list_add(&new_page->lru, head);
 298                 rzs->curr_extent = page_address(new_page);
 299         }
 300
 301         rzs->curr_extent->phy_pagenum = phy_pagenum;
 302         rzs->curr_extent->num_pages = num_pages;
 303
 304         pr_debug("add_extent: idx=%u, phy_pgnum=%lu, num_pgs=%lu, "
 305                 "pg_last=%lu, curr_ext=%p\n", idx, phy_pagenum, num_pages,
 306                 phy_pagenum + num_pages - 1, rzs->curr_extent);
 307
 308         if (idx != extents_per_page - 1)
 309                 rzs->curr_extent++;
 310
 311         return 0;
 312 }
 313
 314 static int setup_backing_swap_extents(struct ramzswap *rzs,
 315                                 struct inode *inode, unsigned long *num_pages)
 316 {
 317         int ret = 0;
 318         unsigned blkbits;
 319         unsigned blocks_per_page;
 320         pgoff_t contig_pages = 0, total_pages = 0;
 321         pgoff_t pagenum = 0, prev_pagenum = 0;
 322         sector_t probe_block = 0;
 323         sector_t last_block;
 324
 325         blkbits = inode->i_blkbits;
 326         blocks_per_page = PAGE_SIZE >> blkbits;
 327
 328         last_block = i_size_read(inode) >> blkbits;
 329         while (probe_block + blocks_per_page <= last_block) {
 330                 unsigned block_in_page;
 331                 sector_t first_block;
 332
 333                 first_block = bmap(inode, probe_block);
 334                 if (first_block == 0)
 335                         goto bad_bmap;
 336
 337                 /* It must be PAGE_SIZE aligned on-disk */
 338                 if (first_block & (blocks_per_page - 1)) {
 339                         probe_block++;
 340                         goto probe_next;
 341                 }
 342
 343                 /* All blocks within this page must be contiguous on disk */
 344                 for (block_in_page = 1; block_in_page < blocks_per_page;
 345                                         block_in_page++) {
 346                         sector_t block;
 347
 348                         block = bmap(inode, probe_block + block_in_page);
 349                         if (block == 0)
 350                                 goto bad_bmap;
 351                         if (block != first_block + block_in_page) {
 352                                 /* Discontiguity */
 353                                 probe_block++;
 354                                 goto probe_next;
 355                         }
 356                 }
 357
 358                 /*
 359                  * We found a PAGE_SIZE length, PAGE_SIZE aligned
 360                  * run of blocks.
 361                  */
 362                 pagenum = first_block >> (PAGE_SHIFT - blkbits);
 363
 364                 if (total_pages && (pagenum != prev_pagenum + 1)) {
 365                         ret = add_backing_swap_extent(rzs, prev_pagenum -
 366                                         (contig_pages - 1), contig_pages);
 367                         if (ret < 0)
 368                                 goto out;
 369                         rzs->num_extents++;
 370                         contig_pages = 0;
 371                 }
 372                 total_pages++;
 373                 contig_pages++;
 374                 prev_pagenum = pagenum;
 375                 probe_block += blocks_per_page;
 376
 377 probe_next:
 378                 continue;
 379         }
 380
 381         if (contig_pages) {
 382                 pr_debug("adding last extent: pagenum=%lu, "
 383                         "contig_pages=%lu\n", pagenum, contig_pages);
 384                 ret = add_backing_swap_extent(rzs,
 385                         prev_pagenum - (contig_pages - 1), contig_pages);
 386                 if (ret < 0)
 387                         goto out;
 388                 rzs->num_extents++;
 389         }
 390         if (!rzs->num_extents) {
 391                 pr_err("No swap extents found!\n");
 392                 ret = -EINVAL;
 393         }
 394
 395         if (!ret) {
 396                 *num_pages = total_pages;
 397                 pr_info("Found %lu extents containing %luk\n",
 398                         rzs->num_extents, *num_pages << (PAGE_SHIFT - 10));
 399         }
 400         goto out;
 401
 402 bad_bmap:
 403         pr_err("Backing swapfile has holes\n");
 404         ret = -EINVAL;
 405 out:
 406         while (ret && !list_empty(&rzs->backing_swap_extent_list)) {
 407                 struct page *page;
 408                 struct list_head *entry = rzs->backing_swap_extent_list.next;
 409                 page = list_entry(entry, struct page, lru);
 410                 list_del(entry);
 411                 __free_page(page);
 412         }
 413         return ret;
 414 }
 415
 416 static void map_backing_swap_extents(struct ramzswap *rzs)
 417 {
 418         struct ramzswap_backing_extent *se;
 419         struct page *table_page, *se_page;
 420         unsigned long num_pages, num_table_pages, entry;
 421         unsigned long se_idx, span;
 422         unsigned entries_per_page = PAGE_SIZE / sizeof(*rzs->table);
 423         unsigned extents_per_page = PAGE_SIZE / sizeof(*se);
 424
 425         /* True for block device */
 426         if (!rzs->num_extents)
 427                 return;
 428
 429         se_page = list_entry(rzs->backing_swap_extent_list.next,
 430                                         struct page, lru);
 431         se = page_address(se_page);
 432         span = se->num_pages;
 433         num_pages = rzs->disksize >> PAGE_SHIFT;
 434         num_table_pages = DIV_ROUND_UP(num_pages * sizeof(*rzs->table),
 435                                                         PAGE_SIZE);
 436
 437         entry = 0;
 438         se_idx = 0;
 439         while (num_table_pages--) {
 440                 table_page = vmalloc_to_page(&rzs->table[entry]);
 441                 while (span <= entry) {
 442                         se_idx++;
 443                         if (se_idx == rzs->num_extents)
 444                                 BUG();
 445
 446                         if (!(se_idx % extents_per_page)) {
 447                                 se_page = list_entry(se_page->lru.next,
 448                                                 struct page, lru);
 449                                 se = page_address(se_page);
 450                         } else
 451                                 se++;
 452
 453                         span += se->num_pages;
 454                 }
 455                 table_page->mapping = (struct address_space *)se;
 456                 table_page->private = se->num_pages - (span - entry);
 457                 pr_debug("map_table: entry=%lu, span=%lu, map=%p, priv=%lu\n",
 458                         entry, span, table_page->mapping, table_page->private);
 459                 entry += entries_per_page;
 460         }
 461 }
 462
 463 /*
 464  * Check if value of backing_swap module param is sane.
 465  * Claim this device and set ramzswap size equal to
 466  * size of this block device.
 467  */
 468 static int setup_backing_swap(struct ramzswap *rzs)
 469 {
 470         int ret = 0;
 471         size_t disksize;
 472         unsigned long num_pages = 0;
 473         struct inode *inode;
 474         struct file *swap_file;
 475         struct address_space *mapping;
 476         struct block_device *bdev = NULL;
 477
 478         if (!rzs->backing_swap_name[0]) {
 479                 pr_debug("backing_swap param not given\n");
 480                 goto out;
 481         }
 482
 483         pr_info("Using backing swap device: %s\n", rzs->backing_swap_name);
 484
 485         swap_file = filp_open(rzs->backing_swap_name,
 486                                 O_RDWR | O_LARGEFILE, 0);
 487         if (IS_ERR(swap_file)) {
 488                 pr_err("Error opening backing device: %s\n",
 489                         rzs->backing_swap_name);
 490                 ret = -EINVAL;
 491                 goto out;
 492         }
 493
 494         mapping = swap_file->f_mapping;
 495         inode = mapping->host;
 496
 497         if (S_ISBLK(inode->i_mode)) {
 498                 bdev = I_BDEV(inode);
 499                 ret = bd_claim(bdev, setup_backing_swap);
 500                 if (ret < 0) {
 501                         bdev = NULL;
 502                         goto bad_param;
 503                 }
 504                 disksize = i_size_read(inode);
 505         } else if (S_ISREG(inode->i_mode)) {
 506                 bdev = inode->i_sb->s_bdev;
 507                 if (IS_SWAPFILE(inode)) {
 508                         ret = -EBUSY;
 509                         goto bad_param;
 510                 }
 511                 ret = setup_backing_swap_extents(rzs, inode, &num_pages);
 512                 if (ret < 0)
 513                         goto bad_param;
 514                 disksize = num_pages << PAGE_SHIFT;
 515         } else {
 516                 goto bad_param;
 517         }
 518
 519         rzs->swap_file = swap_file;
 520         rzs->backing_swap = bdev;
 521         rzs->disksize = disksize;
 522         BUG_ON(!rzs->disksize);
 523
 524         return 0;
 525
 526 bad_param:
 527         if (bdev)
 528                 bd_release(bdev);
 529         filp_close(swap_file, NULL);
 530
 531 out:
 532         rzs->backing_swap = NULL;
 533         return ret;
 534 }
 535
 536 /*
 537  * Map logical page number 'pagenum' to physical page number
 538  * on backing swap device. For block device, this is a nop.
 539  */
 540 u32 map_backing_swap_page(struct ramzswap *rzs, u32 pagenum)
 541 {
 542         u32 skip_pages, entries_per_page;
 543         size_t delta, se_offset, skipped;
 544         struct page *table_page, *se_page;
 545         struct ramzswap_backing_extent *se;
 546
 547         if (!rzs->num_extents)
 548                 return pagenum;
 549
 550         entries_per_page = PAGE_SIZE / sizeof(*rzs->table);
 551
 552         table_page = vmalloc_to_page(&rzs->table[pagenum]);
 553         se = (struct ramzswap_backing_extent *)table_page->mapping;
 554         se_page = virt_to_page(se);
 555
 556         skip_pages = pagenum - (pagenum / entries_per_page * entries_per_page);
 557         se_offset = table_page->private + skip_pages;
 558
 559         if (se_offset < se->num_pages)
 560                 return se->phy_pagenum + se_offset;
 561
 562         skipped = se->num_pages - table_page->private;
 563         do {
 564                 struct ramzswap_backing_extent *se_base;
 565                 u32 se_entries_per_page = PAGE_SIZE / sizeof(*se);
 566
 567                 /* Get next swap extent */
 568                 se_base = (struct ramzswap_backing_extent *)
 569                                                 page_address(se_page);
 570                 if (se - se_base == se_entries_per_page - 1) {
 571                         se_page = list_entry(se_page->lru.next,
 572                                                 struct page, lru);
 573                         se = page_address(se_page);
 574                 } else {
 575                         se++;
 576                 }
 577
 578                 skipped += se->num_pages;
 579         } while (skipped < skip_pages);
 580
 581         delta = skipped - skip_pages;
 582         se_offset = se->num_pages - delta;
 583
 584         return se->phy_pagenum + se_offset;
 585 }
 586
 587 static void ramzswap_free_page(struct ramzswap *rzs, size_t index)
 588 {
 589         u32 clen;
 590         void *obj;
 591
 592         struct page *page = rzs->table[index].page;
 593         u32 offset = rzs->table[index].offset;
 594
 595         if (unlikely(!page)) {
 596                 if (rzs_test_flag(rzs, index, RZS_ZERO)) {
 597                         rzs_clear_flag(rzs, index, RZS_ZERO);
 598                         stat_dec(rzs->stats.pages_zero);
 599                 }
 600                 return;
 601         }
 602
 603         if (unlikely(rzs_test_flag(rzs, index, RZS_UNCOMPRESSED))) {
 604                 clen = PAGE_SIZE;
 605                 __free_page(page);
 606                 rzs_clear_flag(rzs, index, RZS_UNCOMPRESSED);
 607                 stat_dec(rzs->stats.pages_expand);
 608                 goto out;
 609         }
 610
 611         obj = kmap_atomic(page, KM_USER0) + offset;
 612         clen = xv_get_object_size(obj) - sizeof(struct zobj_header);
 613         kunmap_atomic(obj, KM_USER0);
 614
 615         xv_free(rzs->mem_pool, page, offset);
 616         if (clen <= PAGE_SIZE / 2)
 617                 stat_dec(rzs->stats.good_compress);
 618
 619 out:
 620         rzs->stats.compr_size -= clen;
 621         stat_dec(rzs->stats.pages_stored);
 622
 623         rzs->table[index].page = NULL;
 624         rzs->table[index].offset = 0;
 625 }
 626
 627 static int handle_zero_page(struct bio *bio)
 628 {
 629         void *user_mem;
 630         struct page *page = bio->bi_io_vec[0].bv_page;
 631
 632         user_mem = kmap_atomic(page, KM_USER0);
 633         memset(user_mem, 0, PAGE_SIZE);
 634         kunmap_atomic(user_mem, KM_USER0);
 635
 636         flush_dcache_page(page);
 637
 638         set_bit(BIO_UPTODATE, &bio->bi_flags);
 639         bio_endio(bio, 0);
 640         return 0;
 641 }
 642
 643 static int handle_uncompressed_page(struct ramzswap *rzs, struct bio *bio)
 644 {
 645         u32 index;
 646         struct page *page;
 647         unsigned char *user_mem, *cmem;
 648
 649         page = bio->bi_io_vec[0].bv_page;
 650         index = bio->bi_sector >> SECTORS_PER_PAGE_SHIFT;
 651
 652         user_mem = kmap_atomic(page, KM_USER0);
 653         cmem = kmap_atomic(rzs->table[index].page, KM_USER1) +
 654                         rzs->table[index].offset;
 655
 656         memcpy(user_mem, cmem, PAGE_SIZE);
 657         kunmap_atomic(user_mem, KM_USER0);
 658         kunmap_atomic(cmem, KM_USER1);
 659
 660         flush_dcache_page(page);
 661
 662         set_bit(BIO_UPTODATE, &bio->bi_flags);
 663         bio_endio(bio, 0);
 664         return 0;
 665 }
 666
 667
 668 /*
 669  * Called when request page is not present in ramzswap.
 670  * Its either in backing swap device (if present) or
 671  * this is an attempt to read before any previous write
 672  * to this location - this happens due to readahead when
 673  * swap device is read from user-space (e.g. during swapon)
 674  */
 675 static int handle_ramzswap_fault(struct ramzswap *rzs, struct bio *bio)
 676 {
 677         /*
 678          * Always forward such requests to backing swap
 679          * device (if present)
 680          */
 681         if (rzs->backing_swap) {
 682                 u32 pagenum;
 683                 stat_dec(rzs->stats.num_reads);
 684                 stat_inc(rzs->stats.bdev_num_reads);
 685                 bio->bi_bdev = rzs->backing_swap;
 686
 687                 /*
 688                  * In case backing swap is a file, find the right offset within
 689                  * the file corresponding to logical position 'index'. For block
 690                  * device, this is a nop.
 691                  */
 692                 pagenum = bio->bi_sector >> SECTORS_PER_PAGE_SHIFT;
 693                 bio->bi_sector = map_backing_swap_page(rzs, pagenum)
 694                                         << SECTORS_PER_PAGE_SHIFT;
 695                 return 1;
 696         }
 697
 698         /*
 699          * Its unlikely event in case backing dev is
 700          * not present
 701          */
 702         pr_debug("Read before write on swap device: "
 703                 "sector=%lu, size=%u, offset=%u\n",
 704                 (ulong)(bio->bi_sector), bio->bi_size,
 705                 bio->bi_io_vec[0].bv_offset);
 706
 707         /* Do nothing. Just return success */
 708         set_bit(BIO_UPTODATE, &bio->bi_flags);
 709         bio_endio(bio, 0);
 710         return 0;
 711 }
 712
 713 static int ramzswap_read(struct ramzswap *rzs, struct bio *bio)
 714 {
 715         int ret;
 716         u32 index;
 717         size_t clen;
 718         struct page *page;
 719         struct zobj_header *zheader;
 720         unsigned char *user_mem, *cmem;
 721
 722         stat_inc(rzs->stats.num_reads);
 723
 724         page = bio->bi_io_vec[0].bv_page;
 725         index = bio->bi_sector >> SECTORS_PER_PAGE_SHIFT;
 726
 727         if (rzs_test_flag(rzs, index, RZS_ZERO))
 728                 return handle_zero_page(bio);
 729
 730         /* Requested page is not present in compressed area */
 731         if (!rzs->table[index].page)
 732                 return handle_ramzswap_fault(rzs, bio);
 733
 734         /* Page is stored uncompressed since its incompressible */
 735         if (unlikely(rzs_test_flag(rzs, index, RZS_UNCOMPRESSED)))
 736                 return handle_uncompressed_page(rzs, bio);
 737
 738         user_mem = kmap_atomic(page, KM_USER0);
 739         clen = PAGE_SIZE;
 740
 741         cmem = kmap_atomic(rzs->table[index].page, KM_USER1) +
 742                         rzs->table[index].offset;
 743
 744         ret = lzo1x_decompress_safe(
 745                 cmem + sizeof(*zheader),
 746                 xv_get_object_size(cmem) - sizeof(*zheader),
 747                 user_mem, &clen);
 748
 749         kunmap_atomic(user_mem, KM_USER0);
 750         kunmap_atomic(cmem, KM_USER1);
 751
 752         /* should NEVER happen */
 753         if (unlikely(ret != LZO_E_OK)) {
 754                 pr_err("Decompression failed! err=%d, page=%u\n",
 755                         ret, index);
 756                 stat_inc(rzs->stats.failed_reads);
 757                 goto out;
 758         }
 759
 760         flush_dcache_page(page);
 761
 762         set_bit(BIO_UPTODATE, &bio->bi_flags);
 763         bio_endio(bio, 0);
 764         return 0;
 765
 766 out:
 767         bio_io_error(bio);
 768         return 0;
 769 }
 770
 771 static int ramzswap_write(struct ramzswap *rzs, struct bio *bio)
 772 {
 773         int ret, fwd_write_request = 0;
 774         u32 offset, index;
 775         size_t clen;
 776         struct zobj_header *zheader;
 777         struct page *page, *page_store;
 778         unsigned char *user_mem, *cmem, *src;
 779
 780         stat_inc(rzs->stats.num_writes);
 781
 782         page = bio->bi_io_vec[0].bv_page;
 783         index = bio->bi_sector >> SECTORS_PER_PAGE_SHIFT;
 784
 785         src = rzs->compress_buffer;
 786
 787         /*
 788          * System swaps to same sector again when the stored page
 789          * is no longer referenced by any process. So, its now safe
 790          * to free the memory that was allocated for this page.
 791          */
 792         if (rzs->table[index].page)
 793                 ramzswap_free_page(rzs, index);
 794
 795         /*
 796          * No memory ia allocated for zero filled pages.
 797          * Simply clear zero page flag.
 798          */
 799         if (rzs_test_flag(rzs, index, RZS_ZERO)) {
 800                 stat_dec(rzs->stats.pages_zero);
 801                 rzs_clear_flag(rzs, index, RZS_ZERO);
 802         }
 803
 804         mutex_lock(&rzs->lock);
 805
 806         user_mem = kmap_atomic(page, KM_USER0);
 807         if (page_zero_filled(user_mem)) {
 808                 kunmap_atomic(user_mem, KM_USER0);
 809                 mutex_unlock(&rzs->lock);
 810                 stat_inc(rzs->stats.pages_zero);
 811                 rzs_set_flag(rzs, index, RZS_ZERO);
 812
 813                 set_bit(BIO_UPTODATE, &bio->bi_flags);
 814                 bio_endio(bio, 0);
 815                 return 0;
 816         }
 817
 818         if (rzs->backing_swap &&
 819                 (rzs->stats.compr_size > rzs->memlimit - PAGE_SIZE)) {
 820                 kunmap_atomic(user_mem, KM_USER0);
 821                 mutex_unlock(&rzs->lock);
 822                 fwd_write_request = 1;
 823                 goto out;
 824         }
 825
 826         ret = lzo1x_1_compress(user_mem, PAGE_SIZE, src, &clen,
 827                                 rzs->compress_workmem);
 828
 829         kunmap_atomic(user_mem, KM_USER0);
 830
 831         if (unlikely(ret != LZO_E_OK)) {
 832                 mutex_unlock(&rzs->lock);
 833                 pr_err("Compression failed! err=%d\n", ret);
 834                 stat_inc(rzs->stats.failed_writes);
 835                 goto out;
 836         }
 837
 838         /*
 839          * Page is incompressible. Forward it to backing swap
 840          * if present. Otherwise, store it as-is (uncompressed)
 841          * since we do not want to return too many swap write
 842          * errors which has side effect of hanging the system.
 843          */
 844         if (unlikely(clen > max_zpage_size)) {
 845                 if (rzs->backing_swap) {
 846                         mutex_unlock(&rzs->lock);
 847                         fwd_write_request = 1;
 848                         goto out;
 849                 }
 850
 851                 clen = PAGE_SIZE;
 852                 page_store = alloc_page(GFP_NOIO | __GFP_HIGHMEM);
 853                 if (unlikely(!page_store)) {
 854                         mutex_unlock(&rzs->lock);
 855                         pr_info("Error allocating memory for incompressible "
 856                                 "page: %u\n", index);
 857                         stat_inc(rzs->stats.failed_writes);
 858                         goto out;
 859                 }
 860
 861                 offset = 0;
 862                 rzs_set_flag(rzs, index, RZS_UNCOMPRESSED);
 863                 stat_inc(rzs->stats.pages_expand);
 864                 rzs->table[index].page = page_store;
 865                 src = kmap_atomic(page, KM_USER0);
 866                 goto memstore;
 867         }
 868
 869         if (xv_malloc(rzs->mem_pool, clen + sizeof(*zheader),
 870                         &rzs->table[index].page, &offset,
 871                         GFP_NOIO | __GFP_HIGHMEM)) {
 872                 mutex_unlock(&rzs->lock);
 873                 pr_info("Error allocating memory for compressed "
 874                         "page: %u, size=%zu\n", index, clen);
 875                 stat_inc(rzs->stats.failed_writes);
 876                 if (rzs->backing_swap)
 877                         fwd_write_request = 1;
 878                 goto out;
 879         }
 880
 881 memstore:
 882         rzs->table[index].offset = offset;
 883
 884         cmem = kmap_atomic(rzs->table[index].page, KM_USER1) +
 885                         rzs->table[index].offset;
 886
 887 #if 0
 888         /* Back-reference needed for memory defragmentation */
 889         if (!rzs_test_flag(rzs, index, RZS_UNCOMPRESSED)) {
 890                 zheader = (struct zobj_header *)cmem;
 891                 zheader->table_idx = index;
 892                 cmem += sizeof(*zheader);
 893         }
 894 #endif
 895
 896         memcpy(cmem, src, clen);
 897
 898         kunmap_atomic(cmem, KM_USER1);
 899         if (unlikely(rzs_test_flag(rzs, index, RZS_UNCOMPRESSED)))
 900                 kunmap_atomic(src, KM_USER0);
 901
 902         /* Update stats */
 903         rzs->stats.compr_size += clen;
 904         stat_inc(rzs->stats.pages_stored);
 905         if (clen <= PAGE_SIZE / 2)
 906                 stat_inc(rzs->stats.good_compress);
 907
 908         mutex_unlock(&rzs->lock);
 909
 910         set_bit(BIO_UPTODATE, &bio->bi_flags);
 911         bio_endio(bio, 0);
 912         return 0;
 913
 914 out:
 915         if (fwd_write_request) {
 916                 stat_inc(rzs->stats.bdev_num_writes);
 917                 bio->bi_bdev = rzs->backing_swap;
 918 #if 0
 919                 /*
 920                  * TODO: We currently have linear mapping of ramzswap and
 921                  * backing swap sectors. This is not desired since we want
 922                  * to optimize writes to backing swap to minimize disk seeks
 923                  * or have effective wear leveling (for SSDs). Also, a
 924                  * non-linear mapping is required to implement compressed
 925                  * on-disk swapping.
 926                  */
 927                  bio->bi_sector = get_backing_swap_page()
 928                                         << SECTORS_PER_PAGE_SHIFT;
 929 #endif
 930                 /*
 931                  * In case backing swap is a file, find the right offset within
 932                  * the file corresponding to logical position 'index'. For block
 933                  * device, this is a nop.
 934                  */
 935                 bio->bi_sector = map_backing_swap_page(rzs, index)
 936                                         << SECTORS_PER_PAGE_SHIFT;
 937                 return 1;
 938         }
 939
 940         bio_io_error(bio);
 941         return 0;
 942 }
 943
 944
 945 /*
 946  * Check if request is within bounds and page aligned.
 947  */
 948 static inline int valid_swap_request(struct ramzswap *rzs, struct bio *bio)
 949 {
 950         if (unlikely(
 951                 (bio->bi_sector >= (rzs->disksize >> SECTOR_SHIFT)) ||
 952                 (bio->bi_sector & (SECTORS_PER_PAGE - 1)) ||
 953                 (bio->bi_vcnt != 1) ||
 954                 (bio->bi_size != PAGE_SIZE) ||
 955                 (bio->bi_io_vec[0].bv_offset != 0))) {
 956
 957                 return 0;
 958         }
 959
 960         /* swap request is valid */
 961         return 1;
 962 }
 963
 964 /*
 965  * Handler function for all ramzswap I/O requests.
 966  */
 967 static int ramzswap_make_request(struct request_queue *queue, struct bio *bio)
 968 {
 969         int ret = 0;
 970         struct ramzswap *rzs = queue->queuedata;
 971
 972         if (unlikely(!rzs->init_done)) {
 973                 bio_io_error(bio);
 974                 return 0;
 975         }
 976
 977         if (!valid_swap_request(rzs, bio)) {
 978                 stat_inc(rzs->stats.invalid_io);
 979                 bio_io_error(bio);
 980                 return 0;
 981         }
 982
 983         switch (bio_data_dir(bio)) {
 984         case READ:
 985                 ret = ramzswap_read(rzs, bio);
 986                 break;
 987
 988         case WRITE:
 989                 ret = ramzswap_write(rzs, bio);
 990                 break;
 991         }
 992
 993         return ret;
 994 }
 995
 996 static void reset_device(struct ramzswap *rzs)
 997 {
 998         int is_backing_blkdev = 0;
 999         size_t index, num_pages;
1000         unsigned entries_per_page;
1001         unsigned long num_table_pages, entry = 0;
1002
1003         if (rzs->backing_swap && !rzs->num_extents)
1004                 is_backing_blkdev = 1;
1005
1006         num_pages = rzs->disksize >> PAGE_SHIFT;
1007
1008         /* Free various per-device buffers */
1009         kfree(rzs->compress_workmem);
1010         free_pages((unsigned long)rzs->compress_buffer, 1);
1011
1012         rzs->compress_workmem = NULL;
1013         rzs->compress_buffer = NULL;
1014
1015         /* Free all pages that are still in this ramzswap device */
1016         for (index = 0; index < num_pages; index++) {
1017                 struct page *page;
1018                 u16 offset;
1019
1020                 page = rzs->table[index].page;
1021                 offset = rzs->table[index].offset;
1022
1023                 if (!page)
1024                         continue;
1025
1026                 if (unlikely(rzs_test_flag(rzs, index, RZS_UNCOMPRESSED)))
1027                         __free_page(page);
1028                 else
1029                         xv_free(rzs->mem_pool, page, offset);
1030         }
1031
1032         entries_per_page = PAGE_SIZE / sizeof(*rzs->table);
1033         num_table_pages = DIV_ROUND_UP(num_pages * sizeof(*rzs->table),
1034                                         PAGE_SIZE);
1035         /*
1036          * Set page->mapping to NULL for every table page.
1037          * Otherwise, we will hit bad_page() during free.
1038          */
1039         while (rzs->num_extents && num_table_pages--) {
1040                 struct page *page;
1041                 page = vmalloc_to_page(&rzs->table[entry]);
1042                 page->mapping = NULL;
1043                 entry += entries_per_page;
1044         }
1045         vfree(rzs->table);
1046         rzs->table = NULL;
1047
1048         xv_destroy_pool(rzs->mem_pool);
1049         rzs->mem_pool = NULL;
1050
1051         /* Free all swap extent pages */
1052         while (!list_empty(&rzs->backing_swap_extent_list)) {
1053                 struct page *page;
1054                 struct list_head *entry;
1055                 entry = rzs->backing_swap_extent_list.next;
1056                 page = list_entry(entry, struct page, lru);
1057                 list_del(entry);
1058                 __free_page(page);
1059         }
1060         INIT_LIST_HEAD(&rzs->backing_swap_extent_list);
1061         rzs->num_extents = 0;
1062
1063         /* Close backing swap device, if present */
1064         if (rzs->backing_swap) {
1065                 if (is_backing_blkdev)
1066                         bd_release(rzs->backing_swap);
1067                 filp_close(rzs->swap_file, NULL);
1068                 rzs->backing_swap = NULL;
1069         }
1070
1071         /* Reset stats */
1072         memset(&rzs->stats, 0, sizeof(rzs->stats));
1073
1074         rzs->disksize = 0;
1075         rzs->memlimit = 0;
1076
1077         /* Back to uninitialized state */
1078         rzs->init_done = 0;
1079 }
1080
1081 static int ramzswap_ioctl_init_device(struct ramzswap *rzs)
1082 {
1083         int ret;
1084         size_t num_pages;
1085         struct page *page;
1086         union swap_header *swap_header;
1087
1088         if (rzs->init_done) {
1089                 pr_info("Device already initialized!\n");
1090                 return -EBUSY;
1091         }
1092
1093         ret = setup_backing_swap(rzs);
1094         if (ret)
1095                 goto fail;
1096
1097         if (rzs->backing_swap)
1098                 ramzswap_set_memlimit(rzs, totalram_pages << PAGE_SHIFT);
1099         else
1100                 ramzswap_set_disksize(rzs, totalram_pages << PAGE_SHIFT);
1101
1102         rzs->compress_workmem = kzalloc(LZO1X_MEM_COMPRESS, GFP_KERNEL);
1103         if (!rzs->compress_workmem) {
1104                 pr_err("Error allocating compressor working memory!\n");
1105                 ret = -ENOMEM;
1106                 goto fail;
1107         }
1108
1109         rzs->compress_buffer = (void *)__get_free_pages(__GFP_ZERO, 1);
1110         if (!rzs->compress_buffer) {
1111                 pr_err("Error allocating compressor buffer space\n");
1112                 ret = -ENOMEM;
1113                 goto fail;
1114         }
1115
1116         num_pages = rzs->disksize >> PAGE_SHIFT;
1117         rzs->table = vmalloc(num_pages * sizeof(*rzs->table));
1118         if (!rzs->table) {
1119                 pr_err("Error allocating ramzswap address table\n");
1120                 /* To prevent accessing table entries during cleanup */
1121                 rzs->disksize = 0;
1122                 ret = -ENOMEM;
1123                 goto fail;
1124         }
1125         memset(rzs->table, 0, num_pages * sizeof(*rzs->table));
1126
1127         map_backing_swap_extents(rzs);
1128
1129         page = alloc_page(__GFP_ZERO);
1130         if (!page) {
1131                 pr_err("Error allocating swap header page\n");
1132                 ret = -ENOMEM;
1133                 goto fail;
1134         }
1135         rzs->table[0].page = page;
1136         rzs_set_flag(rzs, 0, RZS_UNCOMPRESSED);
1137
1138         swap_header = kmap(page);
1139         ret = setup_swap_header(rzs, swap_header);
1140         kunmap(page);
1141         if (ret) {
1142                 pr_err("Error setting swap header\n");
1143                 goto fail;
1144         }
1145
1146         set_capacity(rzs->disk, rzs->disksize >> SECTOR_SHIFT);
1147
1148         /*
1149          * We have ident mapping of sectors for ramzswap and
1150          * and the backing swap device. So, this queue flag
1151          * should be according to backing dev.
1152          */
1153         if (!rzs->backing_swap ||
1154                         blk_queue_nonrot(rzs->backing_swap->bd_disk->queue))
1155                 queue_flag_set_unlocked(QUEUE_FLAG_NONROT, rzs->disk->queue);
1156
1157         rzs->mem_pool = xv_create_pool();
1158         if (!rzs->mem_pool) {
1159                 pr_err("Error creating memory pool\n");
1160                 ret = -ENOMEM;
1161                 goto fail;
1162         }
1163
1164         /*
1165          * Pages that compress to size greater than this are forwarded
1166          * to physical swap disk (if backing dev is provided)
1167          * TODO: make this configurable
1168          */
1169         if (rzs->backing_swap)
1170                 max_zpage_size = max_zpage_size_bdev;
1171         else
1172                 max_zpage_size = max_zpage_size_nobdev;
1173         pr_debug("Max compressed page size: %u bytes\n", max_zpage_size);
1174
1175         rzs->init_done = 1;
1176
1177         pr_debug("Initialization done!\n");
1178         return 0;
1179
1180 fail:
1181         reset_device(rzs);
1182
1183         pr_err("Initialization failed: err=%d\n", ret);
1184         return ret;
1185 }
1186
1187 static int ramzswap_ioctl_reset_device(struct ramzswap *rzs)
1188 {
1189         if (rzs->init_done)
1190                 reset_device(rzs);
1191
1192         return 0;
1193 }
1194
1195 static int ramzswap_ioctl(struct block_device *bdev, fmode_t mode,
1196                         unsigned int cmd, unsigned long arg)
1197 {
1198         int ret = 0;
1199         size_t disksize_kb, memlimit_kb;
1200
1201         struct ramzswap *rzs = bdev->bd_disk->private_data;
1202
1203         switch (cmd) {
1204         case RZSIO_SET_DISKSIZE_KB:
1205                 if (rzs->init_done) {
1206                         ret = -EBUSY;
1207                         goto out;
1208                 }
1209                 if (copy_from_user(&disksize_kb, (void *)arg,
1210                                                 _IOC_SIZE(cmd))) {
1211                         ret = -EFAULT;
1212                         goto out;
1213                 }
1214                 rzs->disksize = disksize_kb << 10;
1215                 pr_info("Disk size set to %zu kB\n", disksize_kb);
1216                 break;
1217
1218         case RZSIO_SET_MEMLIMIT_KB:
1219                 if (rzs->init_done) {
1220                         /* TODO: allow changing memlimit */
1221                         ret = -EBUSY;
1222                         goto out;
1223                 }
1224                 if (copy_from_user(&memlimit_kb, (void *)arg,
1225                                                 _IOC_SIZE(cmd))) {
1226                         ret = -EFAULT;
1227                         goto out;
1228                 }
1229                 rzs->memlimit = memlimit_kb << 10;
1230                 pr_info("Memory limit set to %zu kB\n", memlimit_kb);
1231                 break;
1232
1233         case RZSIO_SET_BACKING_SWAP:
1234                 if (rzs->init_done) {
1235                         ret = -EBUSY;
1236                         goto out;
1237                 }
1238
1239                 if (copy_from_user(&rzs->backing_swap_name, (void *)arg,
1240                                                 _IOC_SIZE(cmd))) {
1241                         ret = -EFAULT;
1242                         goto out;
1243                 }
1244                 rzs->backing_swap_name[MAX_SWAP_NAME_LEN - 1] = '\0';
1245                 pr_info("Backing swap set to %s\n", rzs->backing_swap_name);
1246                 break;
1247
1248         case RZSIO_GET_STATS:
1249         {
1250                 struct ramzswap_ioctl_stats *stats;
1251                 if (!rzs->init_done) {
1252                         ret = -ENOTTY;
1253                         goto out;
1254                 }
1255                 stats = kzalloc(sizeof(*stats), GFP_KERNEL);
1256                 if (!stats) {
1257                         ret = -ENOMEM;
1258                         goto out;
1259                 }
1260                 ramzswap_ioctl_get_stats(rzs, stats);
1261                 if (copy_to_user((void *)arg, stats, sizeof(*stats))) {
1262                         kfree(stats);
1263                         ret = -EFAULT;
1264                         goto out;
1265                 }
1266                 kfree(stats);
1267                 break;
1268         }
1269         case RZSIO_INIT:
1270                 ret = ramzswap_ioctl_init_device(rzs);
1271                 break;
1272
1273         case RZSIO_RESET:
1274                 /* Do not reset an active device! */
1275                 if (bdev->bd_holders) {
1276                         ret = -EBUSY;
1277                         goto out;
1278                 }
1279                 ret = ramzswap_ioctl_reset_device(rzs);
1280                 break;
1281
1282         default:
1283                 pr_info("Invalid ioctl %u\n", cmd);
1284                 ret = -ENOTTY;
1285         }
1286
1287 out:
1288         return ret;
1289 }
1290
1291 static struct block_device_operations ramzswap_devops = {
1292         .ioctl = ramzswap_ioctl,
1293         .owner = THIS_MODULE,
1294 };
1295
1296 static void create_device(struct ramzswap *rzs, int device_id)
1297 {
1298         mutex_init(&rzs->lock);
1299         INIT_LIST_HEAD(&rzs->backing_swap_extent_list);
1300
1301         rzs->queue = blk_alloc_queue(GFP_KERNEL);
1302         if (!rzs->queue) {
1303                 pr_err("Error allocating disk queue for device %d\n",
1304                         device_id);
1305                 return;
1306         }
1307
1308         blk_queue_make_request(rzs->queue, ramzswap_make_request);
1309         rzs->queue->queuedata = rzs;
1310
1311          /* gendisk structure */
1312         rzs->disk = alloc_disk(1);
1313         if (!rzs->disk) {
1314                 blk_cleanup_queue(rzs->queue);
1315                 pr_warning("Error allocating disk structure for device %d\n",
1316                         device_id);
1317                 return;
1318         }
1319
1320         rzs->disk->major = ramzswap_major;
1321         rzs->disk->first_minor = device_id;
1322         rzs->disk->fops = &ramzswap_devops;
1323         rzs->disk->queue = rzs->queue;
1324         rzs->disk->private_data = rzs;
1325         snprintf(rzs->disk->disk_name, 16, "ramzswap%d", device_id);
1326
1327         /*
1328          * Actual capacity set using RZSIO_SET_DISKSIZE_KB ioctl
1329          * or set equal to backing swap device (if provided)
1330          */
1331         set_capacity(rzs->disk, 0);
1332         add_disk(rzs->disk);
1333
1334         rzs->init_done = 0;
1335 }
1336
1337 static void destroy_device(struct ramzswap *rzs)
1338 {
1339         if (rzs->disk) {
1340                 del_gendisk(rzs->disk);
1341                 put_disk(rzs->disk);
1342         }
1343
1344         if (rzs->queue)
1345                 blk_cleanup_queue(rzs->queue);
1346 }
1347
1348 static int __init ramzswap_init(void)
1349 {
1350         int i, ret;
1351
1352         if (num_devices > max_num_devices) {
1353                 pr_warning("Invalid value for num_devices: %u\n",
1354                                 num_devices);
1355                 return -EINVAL;
1356         }
1357
1358         ramzswap_major = register_blkdev(0, "ramzswap");
1359         if (ramzswap_major <= 0) {
1360                 pr_warning("Unable to get major number\n");
1361                 return -EBUSY;
1362         }
1363
1364         if (!num_devices) {
1365                 pr_info("num_devices not specified. Using default: 1\n");
1366                 num_devices = 1;
1367         }
1368
1369         /* Allocate the device array and initialize each one */
1370         pr_info("Creating %u devices ...\n", num_devices);
1371         devices = kzalloc(num_devices * sizeof(struct ramzswap), GFP_KERNEL);
1372         if (!devices) {
1373                 ret = -ENOMEM;
1374                 goto out;
1375         }
1376
1377         for (i = 0; i < num_devices; i++)
1378                 create_device(&devices[i], i);
1379
1380         return 0;
1381 out:
1382         unregister_blkdev(ramzswap_major, "ramzswap");
1383         return ret;
1384 }
1385
1386 static void __exit ramzswap_exit(void)
1387 {
1388         int i;
1389         struct ramzswap *rzs;
1390
1391         for (i = 0; i < num_devices; i++) {
1392                 rzs = &devices[i];
1393
1394                 destroy_device(rzs);
1395                 if (rzs->init_done)
1396                         reset_device(rzs);
1397         }
1398
1399         unregister_blkdev(ramzswap_major, "ramzswap");
1400
1401         kfree(devices);
1402         pr_debug("Cleanup done!\n");
1403 }
1404
1405 module_param(num_devices, uint, 0);
1406 MODULE_PARM_DESC(num_devices, "Number of ramzswap devices");
1407
1408 module_init(ramzswap_init);
1409 module_exit(ramzswap_exit);
1410
1411 MODULE_LICENSE("Dual BSD/GPL");
1412 MODULE_AUTHOR("Nitin Gupta <ngupta@vflare.org>");
1413 MODULE_DESCRIPTION("Compressed RAM Based Swap Device");