]> git.karo-electronics.de Git - karo-tx-linux.git/blob - drivers/block/virtio_blk.c
virtio-blk: reorganize virtblk_add_req
[karo-tx-linux.git] / drivers / block / virtio_blk.c
1 //#define DEBUG
2 #include <linux/spinlock.h>
3 #include <linux/slab.h>
4 #include <linux/blkdev.h>
5 #include <linux/hdreg.h>
6 #include <linux/module.h>
7 #include <linux/mutex.h>
8 #include <linux/virtio.h>
9 #include <linux/virtio_blk.h>
10 #include <linux/scatterlist.h>
11 #include <linux/string_helpers.h>
12 #include <scsi/scsi_cmnd.h>
13 #include <linux/idr.h>
14
15 #define PART_BITS 4
16
17 static bool use_bio;
18 module_param(use_bio, bool, S_IRUGO);
19
20 static int major;
21 static DEFINE_IDA(vd_index_ida);
22
23 struct workqueue_struct *virtblk_wq;
24
25 struct virtio_blk
26 {
27         struct virtio_device *vdev;
28         struct virtqueue *vq;
29         wait_queue_head_t queue_wait;
30
31         /* The disk structure for the kernel. */
32         struct gendisk *disk;
33
34         mempool_t *pool;
35
36         /* Process context for config space updates */
37         struct work_struct config_work;
38
39         /* Lock for config space updates */
40         struct mutex config_lock;
41
42         /* enable config space updates */
43         bool config_enable;
44
45         /* What host tells us, plus 2 for header & tailer. */
46         unsigned int sg_elems;
47
48         /* Ida index - used to track minor number allocations. */
49         int index;
50
51         /* Scatterlist: can be too big for stack. */
52         struct scatterlist sg[/*sg_elems*/];
53 };
54
55 struct virtblk_req
56 {
57         struct request *req;
58         struct bio *bio;
59         struct virtio_blk_outhdr out_hdr;
60         struct virtio_scsi_inhdr in_hdr;
61         struct work_struct work;
62         struct virtio_blk *vblk;
63         int flags;
64         u8 status;
65         struct scatterlist sg[];
66 };
67
68 enum {
69         VBLK_IS_FLUSH           = 1,
70         VBLK_REQ_FLUSH          = 2,
71         VBLK_REQ_DATA           = 4,
72         VBLK_REQ_FUA            = 8,
73 };
74
75 static inline int virtblk_result(struct virtblk_req *vbr)
76 {
77         switch (vbr->status) {
78         case VIRTIO_BLK_S_OK:
79                 return 0;
80         case VIRTIO_BLK_S_UNSUPP:
81                 return -ENOTTY;
82         default:
83                 return -EIO;
84         }
85 }
86
87 static inline struct virtblk_req *virtblk_alloc_req(struct virtio_blk *vblk,
88                                                     gfp_t gfp_mask)
89 {
90         struct virtblk_req *vbr;
91
92         vbr = mempool_alloc(vblk->pool, gfp_mask);
93         if (!vbr)
94                 return NULL;
95
96         vbr->vblk = vblk;
97         if (use_bio)
98                 sg_init_table(vbr->sg, vblk->sg_elems);
99
100         return vbr;
101 }
102
103 static inline int __virtblk_add_req(struct virtqueue *vq,
104                              struct virtblk_req *vbr,
105                              unsigned long out,
106                              unsigned long in)
107 {
108         return virtqueue_add_buf(vq, vbr->sg, out, in, vbr, GFP_ATOMIC);
109 }
110
111 static void virtblk_add_req(struct virtblk_req *vbr,
112                             unsigned int out, unsigned int in)
113 {
114         struct virtio_blk *vblk = vbr->vblk;
115         DEFINE_WAIT(wait);
116         int ret;
117
118         spin_lock_irq(vblk->disk->queue->queue_lock);
119         while (unlikely((ret = __virtblk_add_req(vblk->vq, vbr,
120                                                  out, in)) < 0)) {
121                 prepare_to_wait_exclusive(&vblk->queue_wait, &wait,
122                                           TASK_UNINTERRUPTIBLE);
123
124                 spin_unlock_irq(vblk->disk->queue->queue_lock);
125                 io_schedule();
126                 spin_lock_irq(vblk->disk->queue->queue_lock);
127
128                 finish_wait(&vblk->queue_wait, &wait);
129         }
130
131         virtqueue_kick(vblk->vq);
132         spin_unlock_irq(vblk->disk->queue->queue_lock);
133 }
134
135 static void virtblk_bio_send_flush(struct virtblk_req *vbr)
136 {
137         unsigned int out = 0, in = 0;
138
139         vbr->flags |= VBLK_IS_FLUSH;
140         vbr->out_hdr.type = VIRTIO_BLK_T_FLUSH;
141         vbr->out_hdr.sector = 0;
142         vbr->out_hdr.ioprio = 0;
143         sg_set_buf(&vbr->sg[out++], &vbr->out_hdr, sizeof(vbr->out_hdr));
144         sg_set_buf(&vbr->sg[out + in++], &vbr->status, sizeof(vbr->status));
145
146         virtblk_add_req(vbr, out, in);
147 }
148
149 static void virtblk_bio_send_data(struct virtblk_req *vbr)
150 {
151         struct virtio_blk *vblk = vbr->vblk;
152         unsigned int num, out = 0, in = 0;
153         struct bio *bio = vbr->bio;
154
155         vbr->flags &= ~VBLK_IS_FLUSH;
156         vbr->out_hdr.type = 0;
157         vbr->out_hdr.sector = bio->bi_sector;
158         vbr->out_hdr.ioprio = bio_prio(bio);
159
160         sg_set_buf(&vbr->sg[out++], &vbr->out_hdr, sizeof(vbr->out_hdr));
161
162         num = blk_bio_map_sg(vblk->disk->queue, bio, vbr->sg + out);
163
164         sg_set_buf(&vbr->sg[num + out + in++], &vbr->status,
165                    sizeof(vbr->status));
166
167         if (num) {
168                 if (bio->bi_rw & REQ_WRITE) {
169                         vbr->out_hdr.type |= VIRTIO_BLK_T_OUT;
170                         out += num;
171                 } else {
172                         vbr->out_hdr.type |= VIRTIO_BLK_T_IN;
173                         in += num;
174                 }
175         }
176
177         virtblk_add_req(vbr, out, in);
178 }
179
180 static void virtblk_bio_send_data_work(struct work_struct *work)
181 {
182         struct virtblk_req *vbr;
183
184         vbr = container_of(work, struct virtblk_req, work);
185
186         virtblk_bio_send_data(vbr);
187 }
188
189 static void virtblk_bio_send_flush_work(struct work_struct *work)
190 {
191         struct virtblk_req *vbr;
192
193         vbr = container_of(work, struct virtblk_req, work);
194
195         virtblk_bio_send_flush(vbr);
196 }
197
198 static inline void virtblk_request_done(struct virtblk_req *vbr)
199 {
200         struct virtio_blk *vblk = vbr->vblk;
201         struct request *req = vbr->req;
202         int error = virtblk_result(vbr);
203
204         if (req->cmd_type == REQ_TYPE_BLOCK_PC) {
205                 req->resid_len = vbr->in_hdr.residual;
206                 req->sense_len = vbr->in_hdr.sense_len;
207                 req->errors = vbr->in_hdr.errors;
208         } else if (req->cmd_type == REQ_TYPE_SPECIAL) {
209                 req->errors = (error != 0);
210         }
211
212         __blk_end_request_all(req, error);
213         mempool_free(vbr, vblk->pool);
214 }
215
216 static inline void virtblk_bio_flush_done(struct virtblk_req *vbr)
217 {
218         struct virtio_blk *vblk = vbr->vblk;
219
220         if (vbr->flags & VBLK_REQ_DATA) {
221                 /* Send out the actual write data */
222                 INIT_WORK(&vbr->work, virtblk_bio_send_data_work);
223                 queue_work(virtblk_wq, &vbr->work);
224         } else {
225                 bio_endio(vbr->bio, virtblk_result(vbr));
226                 mempool_free(vbr, vblk->pool);
227         }
228 }
229
230 static inline void virtblk_bio_data_done(struct virtblk_req *vbr)
231 {
232         struct virtio_blk *vblk = vbr->vblk;
233
234         if (unlikely(vbr->flags & VBLK_REQ_FUA)) {
235                 /* Send out a flush before end the bio */
236                 vbr->flags &= ~VBLK_REQ_DATA;
237                 INIT_WORK(&vbr->work, virtblk_bio_send_flush_work);
238                 queue_work(virtblk_wq, &vbr->work);
239         } else {
240                 bio_endio(vbr->bio, virtblk_result(vbr));
241                 mempool_free(vbr, vblk->pool);
242         }
243 }
244
245 static inline void virtblk_bio_done(struct virtblk_req *vbr)
246 {
247         if (unlikely(vbr->flags & VBLK_IS_FLUSH))
248                 virtblk_bio_flush_done(vbr);
249         else
250                 virtblk_bio_data_done(vbr);
251 }
252
253 static void virtblk_done(struct virtqueue *vq)
254 {
255         struct virtio_blk *vblk = vq->vdev->priv;
256         bool bio_done = false, req_done = false;
257         struct virtblk_req *vbr;
258         unsigned long flags;
259         unsigned int len;
260
261         spin_lock_irqsave(vblk->disk->queue->queue_lock, flags);
262         do {
263                 virtqueue_disable_cb(vq);
264                 while ((vbr = virtqueue_get_buf(vblk->vq, &len)) != NULL) {
265                         if (vbr->bio) {
266                                 virtblk_bio_done(vbr);
267                                 bio_done = true;
268                         } else {
269                                 virtblk_request_done(vbr);
270                                 req_done = true;
271                         }
272                 }
273         } while (!virtqueue_enable_cb(vq));
274         /* In case queue is stopped waiting for more buffers. */
275         if (req_done)
276                 blk_start_queue(vblk->disk->queue);
277         spin_unlock_irqrestore(vblk->disk->queue->queue_lock, flags);
278
279         if (bio_done)
280                 wake_up(&vblk->queue_wait);
281 }
282
283 static bool do_req(struct request_queue *q, struct virtio_blk *vblk,
284                    struct request *req)
285 {
286         unsigned long num, out = 0, in = 0;
287         struct virtblk_req *vbr;
288
289         vbr = virtblk_alloc_req(vblk, GFP_ATOMIC);
290         if (!vbr)
291                 /* When another request finishes we'll try again. */
292                 return false;
293
294         vbr->req = req;
295         vbr->bio = NULL;
296         if (req->cmd_flags & REQ_FLUSH) {
297                 vbr->out_hdr.type = VIRTIO_BLK_T_FLUSH;
298                 vbr->out_hdr.sector = 0;
299                 vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
300         } else {
301                 switch (req->cmd_type) {
302                 case REQ_TYPE_FS:
303                         vbr->out_hdr.type = 0;
304                         vbr->out_hdr.sector = blk_rq_pos(vbr->req);
305                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
306                         break;
307                 case REQ_TYPE_BLOCK_PC:
308                         vbr->out_hdr.type = VIRTIO_BLK_T_SCSI_CMD;
309                         vbr->out_hdr.sector = 0;
310                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
311                         break;
312                 case REQ_TYPE_SPECIAL:
313                         vbr->out_hdr.type = VIRTIO_BLK_T_GET_ID;
314                         vbr->out_hdr.sector = 0;
315                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
316                         break;
317                 default:
318                         /* We don't put anything else in the queue. */
319                         BUG();
320                 }
321         }
322
323         sg_set_buf(&vblk->sg[out++], &vbr->out_hdr, sizeof(vbr->out_hdr));
324
325         /*
326          * If this is a packet command we need a couple of additional headers.
327          * Behind the normal outhdr we put a segment with the scsi command
328          * block, and before the normal inhdr we put the sense data and the
329          * inhdr with additional status information before the normal inhdr.
330          */
331         if (vbr->req->cmd_type == REQ_TYPE_BLOCK_PC)
332                 sg_set_buf(&vblk->sg[out++], vbr->req->cmd, vbr->req->cmd_len);
333
334         num = blk_rq_map_sg(q, vbr->req, vblk->sg + out);
335
336         if (vbr->req->cmd_type == REQ_TYPE_BLOCK_PC) {
337                 sg_set_buf(&vblk->sg[num + out + in++], vbr->req->sense, SCSI_SENSE_BUFFERSIZE);
338                 sg_set_buf(&vblk->sg[num + out + in++], &vbr->in_hdr,
339                            sizeof(vbr->in_hdr));
340         }
341
342         sg_set_buf(&vblk->sg[num + out + in++], &vbr->status,
343                    sizeof(vbr->status));
344
345         if (num) {
346                 if (rq_data_dir(vbr->req) == WRITE) {
347                         vbr->out_hdr.type |= VIRTIO_BLK_T_OUT;
348                         out += num;
349                 } else {
350                         vbr->out_hdr.type |= VIRTIO_BLK_T_IN;
351                         in += num;
352                 }
353         }
354
355         if (virtqueue_add_buf(vblk->vq, vblk->sg, out, in, vbr,
356                               GFP_ATOMIC) < 0) {
357                 mempool_free(vbr, vblk->pool);
358                 return false;
359         }
360
361         return true;
362 }
363
364 static void virtblk_request(struct request_queue *q)
365 {
366         struct virtio_blk *vblk = q->queuedata;
367         struct request *req;
368         unsigned int issued = 0;
369
370         while ((req = blk_peek_request(q)) != NULL) {
371                 BUG_ON(req->nr_phys_segments + 2 > vblk->sg_elems);
372
373                 /* If this request fails, stop queue and wait for something to
374                    finish to restart it. */
375                 if (!do_req(q, vblk, req)) {
376                         blk_stop_queue(q);
377                         break;
378                 }
379                 blk_start_request(req);
380                 issued++;
381         }
382
383         if (issued)
384                 virtqueue_kick(vblk->vq);
385 }
386
387 static void virtblk_make_request(struct request_queue *q, struct bio *bio)
388 {
389         struct virtio_blk *vblk = q->queuedata;
390         struct virtblk_req *vbr;
391
392         BUG_ON(bio->bi_phys_segments + 2 > vblk->sg_elems);
393
394         vbr = virtblk_alloc_req(vblk, GFP_NOIO);
395         if (!vbr) {
396                 bio_endio(bio, -ENOMEM);
397                 return;
398         }
399
400         vbr->bio = bio;
401         vbr->flags = 0;
402         if (bio->bi_rw & REQ_FLUSH)
403                 vbr->flags |= VBLK_REQ_FLUSH;
404         if (bio->bi_rw & REQ_FUA)
405                 vbr->flags |= VBLK_REQ_FUA;
406         if (bio->bi_size)
407                 vbr->flags |= VBLK_REQ_DATA;
408
409         if (unlikely(vbr->flags & VBLK_REQ_FLUSH))
410                 virtblk_bio_send_flush(vbr);
411         else
412                 virtblk_bio_send_data(vbr);
413 }
414
415 /* return id (s/n) string for *disk to *id_str
416  */
417 static int virtblk_get_id(struct gendisk *disk, char *id_str)
418 {
419         struct virtio_blk *vblk = disk->private_data;
420         struct request *req;
421         struct bio *bio;
422         int err;
423
424         bio = bio_map_kern(vblk->disk->queue, id_str, VIRTIO_BLK_ID_BYTES,
425                            GFP_KERNEL);
426         if (IS_ERR(bio))
427                 return PTR_ERR(bio);
428
429         req = blk_make_request(vblk->disk->queue, bio, GFP_KERNEL);
430         if (IS_ERR(req)) {
431                 bio_put(bio);
432                 return PTR_ERR(req);
433         }
434
435         req->cmd_type = REQ_TYPE_SPECIAL;
436         err = blk_execute_rq(vblk->disk->queue, vblk->disk, req, false);
437         blk_put_request(req);
438
439         return err;
440 }
441
442 static int virtblk_ioctl(struct block_device *bdev, fmode_t mode,
443                              unsigned int cmd, unsigned long data)
444 {
445         struct gendisk *disk = bdev->bd_disk;
446         struct virtio_blk *vblk = disk->private_data;
447
448         /*
449          * Only allow the generic SCSI ioctls if the host can support it.
450          */
451         if (!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_SCSI))
452                 return -ENOTTY;
453
454         return scsi_cmd_blk_ioctl(bdev, mode, cmd,
455                                   (void __user *)data);
456 }
457
458 /* We provide getgeo only to please some old bootloader/partitioning tools */
459 static int virtblk_getgeo(struct block_device *bd, struct hd_geometry *geo)
460 {
461         struct virtio_blk *vblk = bd->bd_disk->private_data;
462         struct virtio_blk_geometry vgeo;
463         int err;
464
465         /* see if the host passed in geometry config */
466         err = virtio_config_val(vblk->vdev, VIRTIO_BLK_F_GEOMETRY,
467                                 offsetof(struct virtio_blk_config, geometry),
468                                 &vgeo);
469
470         if (!err) {
471                 geo->heads = vgeo.heads;
472                 geo->sectors = vgeo.sectors;
473                 geo->cylinders = vgeo.cylinders;
474         } else {
475                 /* some standard values, similar to sd */
476                 geo->heads = 1 << 6;
477                 geo->sectors = 1 << 5;
478                 geo->cylinders = get_capacity(bd->bd_disk) >> 11;
479         }
480         return 0;
481 }
482
483 static const struct block_device_operations virtblk_fops = {
484         .ioctl  = virtblk_ioctl,
485         .owner  = THIS_MODULE,
486         .getgeo = virtblk_getgeo,
487 };
488
489 static int index_to_minor(int index)
490 {
491         return index << PART_BITS;
492 }
493
494 static int minor_to_index(int minor)
495 {
496         return minor >> PART_BITS;
497 }
498
499 static ssize_t virtblk_serial_show(struct device *dev,
500                                 struct device_attribute *attr, char *buf)
501 {
502         struct gendisk *disk = dev_to_disk(dev);
503         int err;
504
505         /* sysfs gives us a PAGE_SIZE buffer */
506         BUILD_BUG_ON(PAGE_SIZE < VIRTIO_BLK_ID_BYTES);
507
508         buf[VIRTIO_BLK_ID_BYTES] = '\0';
509         err = virtblk_get_id(disk, buf);
510         if (!err)
511                 return strlen(buf);
512
513         if (err == -EIO) /* Unsupported? Make it empty. */
514                 return 0;
515
516         return err;
517 }
518 DEVICE_ATTR(serial, S_IRUGO, virtblk_serial_show, NULL);
519
520 static void virtblk_config_changed_work(struct work_struct *work)
521 {
522         struct virtio_blk *vblk =
523                 container_of(work, struct virtio_blk, config_work);
524         struct virtio_device *vdev = vblk->vdev;
525         struct request_queue *q = vblk->disk->queue;
526         char cap_str_2[10], cap_str_10[10];
527         char *envp[] = { "RESIZE=1", NULL };
528         u64 capacity, size;
529
530         mutex_lock(&vblk->config_lock);
531         if (!vblk->config_enable)
532                 goto done;
533
534         /* Host must always specify the capacity. */
535         vdev->config->get(vdev, offsetof(struct virtio_blk_config, capacity),
536                           &capacity, sizeof(capacity));
537
538         /* If capacity is too big, truncate with warning. */
539         if ((sector_t)capacity != capacity) {
540                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
541                          (unsigned long long)capacity);
542                 capacity = (sector_t)-1;
543         }
544
545         size = capacity * queue_logical_block_size(q);
546         string_get_size(size, STRING_UNITS_2, cap_str_2, sizeof(cap_str_2));
547         string_get_size(size, STRING_UNITS_10, cap_str_10, sizeof(cap_str_10));
548
549         dev_notice(&vdev->dev,
550                   "new size: %llu %d-byte logical blocks (%s/%s)\n",
551                   (unsigned long long)capacity,
552                   queue_logical_block_size(q),
553                   cap_str_10, cap_str_2);
554
555         set_capacity(vblk->disk, capacity);
556         revalidate_disk(vblk->disk);
557         kobject_uevent_env(&disk_to_dev(vblk->disk)->kobj, KOBJ_CHANGE, envp);
558 done:
559         mutex_unlock(&vblk->config_lock);
560 }
561
562 static void virtblk_config_changed(struct virtio_device *vdev)
563 {
564         struct virtio_blk *vblk = vdev->priv;
565
566         queue_work(virtblk_wq, &vblk->config_work);
567 }
568
569 static int init_vq(struct virtio_blk *vblk)
570 {
571         int err = 0;
572
573         /* We expect one virtqueue, for output. */
574         vblk->vq = virtio_find_single_vq(vblk->vdev, virtblk_done, "requests");
575         if (IS_ERR(vblk->vq))
576                 err = PTR_ERR(vblk->vq);
577
578         return err;
579 }
580
581 /*
582  * Legacy naming scheme used for virtio devices.  We are stuck with it for
583  * virtio blk but don't ever use it for any new driver.
584  */
585 static int virtblk_name_format(char *prefix, int index, char *buf, int buflen)
586 {
587         const int base = 'z' - 'a' + 1;
588         char *begin = buf + strlen(prefix);
589         char *end = buf + buflen;
590         char *p;
591         int unit;
592
593         p = end - 1;
594         *p = '\0';
595         unit = base;
596         do {
597                 if (p == begin)
598                         return -EINVAL;
599                 *--p = 'a' + (index % unit);
600                 index = (index / unit) - 1;
601         } while (index >= 0);
602
603         memmove(begin, p, end - p);
604         memcpy(buf, prefix, strlen(prefix));
605
606         return 0;
607 }
608
609 static int virtblk_get_cache_mode(struct virtio_device *vdev)
610 {
611         u8 writeback;
612         int err;
613
614         err = virtio_config_val(vdev, VIRTIO_BLK_F_CONFIG_WCE,
615                                 offsetof(struct virtio_blk_config, wce),
616                                 &writeback);
617         if (err)
618                 writeback = virtio_has_feature(vdev, VIRTIO_BLK_F_WCE);
619
620         return writeback;
621 }
622
623 static void virtblk_update_cache_mode(struct virtio_device *vdev)
624 {
625         u8 writeback = virtblk_get_cache_mode(vdev);
626         struct virtio_blk *vblk = vdev->priv;
627
628         if (writeback)
629                 blk_queue_flush(vblk->disk->queue, REQ_FLUSH);
630         else
631                 blk_queue_flush(vblk->disk->queue, 0);
632
633         revalidate_disk(vblk->disk);
634 }
635
636 static const char *const virtblk_cache_types[] = {
637         "write through", "write back"
638 };
639
640 static ssize_t
641 virtblk_cache_type_store(struct device *dev, struct device_attribute *attr,
642                          const char *buf, size_t count)
643 {
644         struct gendisk *disk = dev_to_disk(dev);
645         struct virtio_blk *vblk = disk->private_data;
646         struct virtio_device *vdev = vblk->vdev;
647         int i;
648         u8 writeback;
649
650         BUG_ON(!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_CONFIG_WCE));
651         for (i = ARRAY_SIZE(virtblk_cache_types); --i >= 0; )
652                 if (sysfs_streq(buf, virtblk_cache_types[i]))
653                         break;
654
655         if (i < 0)
656                 return -EINVAL;
657
658         writeback = i;
659         vdev->config->set(vdev,
660                           offsetof(struct virtio_blk_config, wce),
661                           &writeback, sizeof(writeback));
662
663         virtblk_update_cache_mode(vdev);
664         return count;
665 }
666
667 static ssize_t
668 virtblk_cache_type_show(struct device *dev, struct device_attribute *attr,
669                          char *buf)
670 {
671         struct gendisk *disk = dev_to_disk(dev);
672         struct virtio_blk *vblk = disk->private_data;
673         u8 writeback = virtblk_get_cache_mode(vblk->vdev);
674
675         BUG_ON(writeback >= ARRAY_SIZE(virtblk_cache_types));
676         return snprintf(buf, 40, "%s\n", virtblk_cache_types[writeback]);
677 }
678
679 static const struct device_attribute dev_attr_cache_type_ro =
680         __ATTR(cache_type, S_IRUGO,
681                virtblk_cache_type_show, NULL);
682 static const struct device_attribute dev_attr_cache_type_rw =
683         __ATTR(cache_type, S_IRUGO|S_IWUSR,
684                virtblk_cache_type_show, virtblk_cache_type_store);
685
686 static int virtblk_probe(struct virtio_device *vdev)
687 {
688         struct virtio_blk *vblk;
689         struct request_queue *q;
690         int err, index;
691         int pool_size;
692
693         u64 cap;
694         u32 v, blk_size, sg_elems, opt_io_size;
695         u16 min_io_size;
696         u8 physical_block_exp, alignment_offset;
697
698         err = ida_simple_get(&vd_index_ida, 0, minor_to_index(1 << MINORBITS),
699                              GFP_KERNEL);
700         if (err < 0)
701                 goto out;
702         index = err;
703
704         /* We need to know how many segments before we allocate. */
705         err = virtio_config_val(vdev, VIRTIO_BLK_F_SEG_MAX,
706                                 offsetof(struct virtio_blk_config, seg_max),
707                                 &sg_elems);
708
709         /* We need at least one SG element, whatever they say. */
710         if (err || !sg_elems)
711                 sg_elems = 1;
712
713         /* We need an extra sg elements at head and tail. */
714         sg_elems += 2;
715         vdev->priv = vblk = kmalloc(sizeof(*vblk) +
716                                     sizeof(vblk->sg[0]) * sg_elems, GFP_KERNEL);
717         if (!vblk) {
718                 err = -ENOMEM;
719                 goto out_free_index;
720         }
721
722         init_waitqueue_head(&vblk->queue_wait);
723         vblk->vdev = vdev;
724         vblk->sg_elems = sg_elems;
725         sg_init_table(vblk->sg, vblk->sg_elems);
726         mutex_init(&vblk->config_lock);
727
728         INIT_WORK(&vblk->config_work, virtblk_config_changed_work);
729         vblk->config_enable = true;
730
731         err = init_vq(vblk);
732         if (err)
733                 goto out_free_vblk;
734
735         pool_size = sizeof(struct virtblk_req);
736         if (use_bio)
737                 pool_size += sizeof(struct scatterlist) * sg_elems;
738         vblk->pool = mempool_create_kmalloc_pool(1, pool_size);
739         if (!vblk->pool) {
740                 err = -ENOMEM;
741                 goto out_free_vq;
742         }
743
744         /* FIXME: How many partitions?  How long is a piece of string? */
745         vblk->disk = alloc_disk(1 << PART_BITS);
746         if (!vblk->disk) {
747                 err = -ENOMEM;
748                 goto out_mempool;
749         }
750
751         q = vblk->disk->queue = blk_init_queue(virtblk_request, NULL);
752         if (!q) {
753                 err = -ENOMEM;
754                 goto out_put_disk;
755         }
756
757         if (use_bio)
758                 blk_queue_make_request(q, virtblk_make_request);
759         q->queuedata = vblk;
760
761         virtblk_name_format("vd", index, vblk->disk->disk_name, DISK_NAME_LEN);
762
763         vblk->disk->major = major;
764         vblk->disk->first_minor = index_to_minor(index);
765         vblk->disk->private_data = vblk;
766         vblk->disk->fops = &virtblk_fops;
767         vblk->disk->driverfs_dev = &vdev->dev;
768         vblk->index = index;
769
770         /* configure queue flush support */
771         virtblk_update_cache_mode(vdev);
772
773         /* If disk is read-only in the host, the guest should obey */
774         if (virtio_has_feature(vdev, VIRTIO_BLK_F_RO))
775                 set_disk_ro(vblk->disk, 1);
776
777         /* Host must always specify the capacity. */
778         vdev->config->get(vdev, offsetof(struct virtio_blk_config, capacity),
779                           &cap, sizeof(cap));
780
781         /* If capacity is too big, truncate with warning. */
782         if ((sector_t)cap != cap) {
783                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
784                          (unsigned long long)cap);
785                 cap = (sector_t)-1;
786         }
787         set_capacity(vblk->disk, cap);
788
789         /* We can handle whatever the host told us to handle. */
790         blk_queue_max_segments(q, vblk->sg_elems-2);
791
792         /* No need to bounce any requests */
793         blk_queue_bounce_limit(q, BLK_BOUNCE_ANY);
794
795         /* No real sector limit. */
796         blk_queue_max_hw_sectors(q, -1U);
797
798         /* Host can optionally specify maximum segment size and number of
799          * segments. */
800         err = virtio_config_val(vdev, VIRTIO_BLK_F_SIZE_MAX,
801                                 offsetof(struct virtio_blk_config, size_max),
802                                 &v);
803         if (!err)
804                 blk_queue_max_segment_size(q, v);
805         else
806                 blk_queue_max_segment_size(q, -1U);
807
808         /* Host can optionally specify the block size of the device */
809         err = virtio_config_val(vdev, VIRTIO_BLK_F_BLK_SIZE,
810                                 offsetof(struct virtio_blk_config, blk_size),
811                                 &blk_size);
812         if (!err)
813                 blk_queue_logical_block_size(q, blk_size);
814         else
815                 blk_size = queue_logical_block_size(q);
816
817         /* Use topology information if available */
818         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
819                         offsetof(struct virtio_blk_config, physical_block_exp),
820                         &physical_block_exp);
821         if (!err && physical_block_exp)
822                 blk_queue_physical_block_size(q,
823                                 blk_size * (1 << physical_block_exp));
824
825         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
826                         offsetof(struct virtio_blk_config, alignment_offset),
827                         &alignment_offset);
828         if (!err && alignment_offset)
829                 blk_queue_alignment_offset(q, blk_size * alignment_offset);
830
831         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
832                         offsetof(struct virtio_blk_config, min_io_size),
833                         &min_io_size);
834         if (!err && min_io_size)
835                 blk_queue_io_min(q, blk_size * min_io_size);
836
837         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
838                         offsetof(struct virtio_blk_config, opt_io_size),
839                         &opt_io_size);
840         if (!err && opt_io_size)
841                 blk_queue_io_opt(q, blk_size * opt_io_size);
842
843         add_disk(vblk->disk);
844         err = device_create_file(disk_to_dev(vblk->disk), &dev_attr_serial);
845         if (err)
846                 goto out_del_disk;
847
848         if (virtio_has_feature(vdev, VIRTIO_BLK_F_CONFIG_WCE))
849                 err = device_create_file(disk_to_dev(vblk->disk),
850                                          &dev_attr_cache_type_rw);
851         else
852                 err = device_create_file(disk_to_dev(vblk->disk),
853                                          &dev_attr_cache_type_ro);
854         if (err)
855                 goto out_del_disk;
856         return 0;
857
858 out_del_disk:
859         del_gendisk(vblk->disk);
860         blk_cleanup_queue(vblk->disk->queue);
861 out_put_disk:
862         put_disk(vblk->disk);
863 out_mempool:
864         mempool_destroy(vblk->pool);
865 out_free_vq:
866         vdev->config->del_vqs(vdev);
867 out_free_vblk:
868         kfree(vblk);
869 out_free_index:
870         ida_simple_remove(&vd_index_ida, index);
871 out:
872         return err;
873 }
874
875 static void virtblk_remove(struct virtio_device *vdev)
876 {
877         struct virtio_blk *vblk = vdev->priv;
878         int index = vblk->index;
879         int refc;
880
881         /* Prevent config work handler from accessing the device. */
882         mutex_lock(&vblk->config_lock);
883         vblk->config_enable = false;
884         mutex_unlock(&vblk->config_lock);
885
886         del_gendisk(vblk->disk);
887         blk_cleanup_queue(vblk->disk->queue);
888
889         /* Stop all the virtqueues. */
890         vdev->config->reset(vdev);
891
892         flush_work(&vblk->config_work);
893
894         refc = atomic_read(&disk_to_dev(vblk->disk)->kobj.kref.refcount);
895         put_disk(vblk->disk);
896         mempool_destroy(vblk->pool);
897         vdev->config->del_vqs(vdev);
898         kfree(vblk);
899
900         /* Only free device id if we don't have any users */
901         if (refc == 1)
902                 ida_simple_remove(&vd_index_ida, index);
903 }
904
905 #ifdef CONFIG_PM
906 static int virtblk_freeze(struct virtio_device *vdev)
907 {
908         struct virtio_blk *vblk = vdev->priv;
909
910         /* Ensure we don't receive any more interrupts */
911         vdev->config->reset(vdev);
912
913         /* Prevent config work handler from accessing the device. */
914         mutex_lock(&vblk->config_lock);
915         vblk->config_enable = false;
916         mutex_unlock(&vblk->config_lock);
917
918         flush_work(&vblk->config_work);
919
920         spin_lock_irq(vblk->disk->queue->queue_lock);
921         blk_stop_queue(vblk->disk->queue);
922         spin_unlock_irq(vblk->disk->queue->queue_lock);
923         blk_sync_queue(vblk->disk->queue);
924
925         vdev->config->del_vqs(vdev);
926         return 0;
927 }
928
929 static int virtblk_restore(struct virtio_device *vdev)
930 {
931         struct virtio_blk *vblk = vdev->priv;
932         int ret;
933
934         vblk->config_enable = true;
935         ret = init_vq(vdev->priv);
936         if (!ret) {
937                 spin_lock_irq(vblk->disk->queue->queue_lock);
938                 blk_start_queue(vblk->disk->queue);
939                 spin_unlock_irq(vblk->disk->queue->queue_lock);
940         }
941         return ret;
942 }
943 #endif
944
945 static const struct virtio_device_id id_table[] = {
946         { VIRTIO_ID_BLOCK, VIRTIO_DEV_ANY_ID },
947         { 0 },
948 };
949
950 static unsigned int features[] = {
951         VIRTIO_BLK_F_SEG_MAX, VIRTIO_BLK_F_SIZE_MAX, VIRTIO_BLK_F_GEOMETRY,
952         VIRTIO_BLK_F_RO, VIRTIO_BLK_F_BLK_SIZE, VIRTIO_BLK_F_SCSI,
953         VIRTIO_BLK_F_WCE, VIRTIO_BLK_F_TOPOLOGY, VIRTIO_BLK_F_CONFIG_WCE
954 };
955
956 static struct virtio_driver virtio_blk = {
957         .feature_table          = features,
958         .feature_table_size     = ARRAY_SIZE(features),
959         .driver.name            = KBUILD_MODNAME,
960         .driver.owner           = THIS_MODULE,
961         .id_table               = id_table,
962         .probe                  = virtblk_probe,
963         .remove                 = virtblk_remove,
964         .config_changed         = virtblk_config_changed,
965 #ifdef CONFIG_PM
966         .freeze                 = virtblk_freeze,
967         .restore                = virtblk_restore,
968 #endif
969 };
970
971 static int __init init(void)
972 {
973         int error;
974
975         virtblk_wq = alloc_workqueue("virtio-blk", 0, 0);
976         if (!virtblk_wq)
977                 return -ENOMEM;
978
979         major = register_blkdev(0, "virtblk");
980         if (major < 0) {
981                 error = major;
982                 goto out_destroy_workqueue;
983         }
984
985         error = register_virtio_driver(&virtio_blk);
986         if (error)
987                 goto out_unregister_blkdev;
988         return 0;
989
990 out_unregister_blkdev:
991         unregister_blkdev(major, "virtblk");
992 out_destroy_workqueue:
993         destroy_workqueue(virtblk_wq);
994         return error;
995 }
996
997 static void __exit fini(void)
998 {
999         unregister_blkdev(major, "virtblk");
1000         unregister_virtio_driver(&virtio_blk);
1001         destroy_workqueue(virtblk_wq);
1002 }
1003 module_init(init);
1004 module_exit(fini);
1005
1006 MODULE_DEVICE_TABLE(virtio, id_table);
1007 MODULE_DESCRIPTION("Virtio block driver");
1008 MODULE_LICENSE("GPL");