]> git.karo-electronics.de Git - karo-tx-linux.git/blob - drivers/block/virtio_blk.c
Merge branch 'for-3.16/core' of git://git.kernel.dk/linux-block into next
[karo-tx-linux.git] / drivers / block / virtio_blk.c
1 //#define DEBUG
2 #include <linux/spinlock.h>
3 #include <linux/slab.h>
4 #include <linux/blkdev.h>
5 #include <linux/hdreg.h>
6 #include <linux/module.h>
7 #include <linux/mutex.h>
8 #include <linux/virtio.h>
9 #include <linux/virtio_blk.h>
10 #include <linux/scatterlist.h>
11 #include <linux/string_helpers.h>
12 #include <scsi/scsi_cmnd.h>
13 #include <linux/idr.h>
14 #include <linux/blk-mq.h>
15 #include <linux/numa.h>
16
17 #define PART_BITS 4
18
19 static int major;
20 static DEFINE_IDA(vd_index_ida);
21
22 static struct workqueue_struct *virtblk_wq;
23
24 struct virtio_blk
25 {
26         struct virtio_device *vdev;
27         struct virtqueue *vq;
28         spinlock_t vq_lock;
29
30         /* The disk structure for the kernel. */
31         struct gendisk *disk;
32
33         /* Block layer tags. */
34         struct blk_mq_tag_set tag_set;
35
36         /* Process context for config space updates */
37         struct work_struct config_work;
38
39         /* Lock for config space updates */
40         struct mutex config_lock;
41
42         /* enable config space updates */
43         bool config_enable;
44
45         /* What host tells us, plus 2 for header & tailer. */
46         unsigned int sg_elems;
47
48         /* Ida index - used to track minor number allocations. */
49         int index;
50 };
51
52 struct virtblk_req
53 {
54         struct request *req;
55         struct virtio_blk_outhdr out_hdr;
56         struct virtio_scsi_inhdr in_hdr;
57         u8 status;
58         struct scatterlist sg[];
59 };
60
61 static inline int virtblk_result(struct virtblk_req *vbr)
62 {
63         switch (vbr->status) {
64         case VIRTIO_BLK_S_OK:
65                 return 0;
66         case VIRTIO_BLK_S_UNSUPP:
67                 return -ENOTTY;
68         default:
69                 return -EIO;
70         }
71 }
72
73 static int __virtblk_add_req(struct virtqueue *vq,
74                              struct virtblk_req *vbr,
75                              struct scatterlist *data_sg,
76                              bool have_data)
77 {
78         struct scatterlist hdr, status, cmd, sense, inhdr, *sgs[6];
79         unsigned int num_out = 0, num_in = 0;
80         int type = vbr->out_hdr.type & ~VIRTIO_BLK_T_OUT;
81
82         sg_init_one(&hdr, &vbr->out_hdr, sizeof(vbr->out_hdr));
83         sgs[num_out++] = &hdr;
84
85         /*
86          * If this is a packet command we need a couple of additional headers.
87          * Behind the normal outhdr we put a segment with the scsi command
88          * block, and before the normal inhdr we put the sense data and the
89          * inhdr with additional status information.
90          */
91         if (type == VIRTIO_BLK_T_SCSI_CMD) {
92                 sg_init_one(&cmd, vbr->req->cmd, vbr->req->cmd_len);
93                 sgs[num_out++] = &cmd;
94         }
95
96         if (have_data) {
97                 if (vbr->out_hdr.type & VIRTIO_BLK_T_OUT)
98                         sgs[num_out++] = data_sg;
99                 else
100                         sgs[num_out + num_in++] = data_sg;
101         }
102
103         if (type == VIRTIO_BLK_T_SCSI_CMD) {
104                 sg_init_one(&sense, vbr->req->sense, SCSI_SENSE_BUFFERSIZE);
105                 sgs[num_out + num_in++] = &sense;
106                 sg_init_one(&inhdr, &vbr->in_hdr, sizeof(vbr->in_hdr));
107                 sgs[num_out + num_in++] = &inhdr;
108         }
109
110         sg_init_one(&status, &vbr->status, sizeof(vbr->status));
111         sgs[num_out + num_in++] = &status;
112
113         return virtqueue_add_sgs(vq, sgs, num_out, num_in, vbr, GFP_ATOMIC);
114 }
115
116 static inline void virtblk_request_done(struct request *req)
117 {
118         struct virtblk_req *vbr = blk_mq_rq_to_pdu(req);
119         int error = virtblk_result(vbr);
120
121         if (req->cmd_type == REQ_TYPE_BLOCK_PC) {
122                 req->resid_len = vbr->in_hdr.residual;
123                 req->sense_len = vbr->in_hdr.sense_len;
124                 req->errors = vbr->in_hdr.errors;
125         } else if (req->cmd_type == REQ_TYPE_SPECIAL) {
126                 req->errors = (error != 0);
127         }
128
129         blk_mq_end_io(req, error);
130 }
131
132 static void virtblk_done(struct virtqueue *vq)
133 {
134         struct virtio_blk *vblk = vq->vdev->priv;
135         bool req_done = false;
136         struct virtblk_req *vbr;
137         unsigned long flags;
138         unsigned int len;
139
140         spin_lock_irqsave(&vblk->vq_lock, flags);
141         do {
142                 virtqueue_disable_cb(vq);
143                 while ((vbr = virtqueue_get_buf(vblk->vq, &len)) != NULL) {
144                         blk_mq_complete_request(vbr->req);
145                         req_done = true;
146                 }
147                 if (unlikely(virtqueue_is_broken(vq)))
148                         break;
149         } while (!virtqueue_enable_cb(vq));
150
151         /* In case queue is stopped waiting for more buffers. */
152         if (req_done)
153                 blk_mq_start_stopped_hw_queues(vblk->disk->queue, true);
154         spin_unlock_irqrestore(&vblk->vq_lock, flags);
155 }
156
157 static int virtio_queue_rq(struct blk_mq_hw_ctx *hctx, struct request *req)
158 {
159         struct virtio_blk *vblk = hctx->queue->queuedata;
160         struct virtblk_req *vbr = blk_mq_rq_to_pdu(req);
161         unsigned long flags;
162         unsigned int num;
163         const bool last = (req->cmd_flags & REQ_END) != 0;
164         int err;
165
166         BUG_ON(req->nr_phys_segments + 2 > vblk->sg_elems);
167
168         vbr->req = req;
169         if (req->cmd_flags & REQ_FLUSH) {
170                 vbr->out_hdr.type = VIRTIO_BLK_T_FLUSH;
171                 vbr->out_hdr.sector = 0;
172                 vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
173         } else {
174                 switch (req->cmd_type) {
175                 case REQ_TYPE_FS:
176                         vbr->out_hdr.type = 0;
177                         vbr->out_hdr.sector = blk_rq_pos(vbr->req);
178                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
179                         break;
180                 case REQ_TYPE_BLOCK_PC:
181                         vbr->out_hdr.type = VIRTIO_BLK_T_SCSI_CMD;
182                         vbr->out_hdr.sector = 0;
183                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
184                         break;
185                 case REQ_TYPE_SPECIAL:
186                         vbr->out_hdr.type = VIRTIO_BLK_T_GET_ID;
187                         vbr->out_hdr.sector = 0;
188                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
189                         break;
190                 default:
191                         /* We don't put anything else in the queue. */
192                         BUG();
193                 }
194         }
195
196         num = blk_rq_map_sg(hctx->queue, vbr->req, vbr->sg);
197         if (num) {
198                 if (rq_data_dir(vbr->req) == WRITE)
199                         vbr->out_hdr.type |= VIRTIO_BLK_T_OUT;
200                 else
201                         vbr->out_hdr.type |= VIRTIO_BLK_T_IN;
202         }
203
204         spin_lock_irqsave(&vblk->vq_lock, flags);
205         err = __virtblk_add_req(vblk->vq, vbr, vbr->sg, num);
206         if (err) {
207                 virtqueue_kick(vblk->vq);
208                 blk_mq_stop_hw_queue(hctx);
209                 spin_unlock_irqrestore(&vblk->vq_lock, flags);
210                 /* Out of mem doesn't actually happen, since we fall back
211                  * to direct descriptors */
212                 if (err == -ENOMEM || err == -ENOSPC)
213                         return BLK_MQ_RQ_QUEUE_BUSY;
214                 return BLK_MQ_RQ_QUEUE_ERROR;
215         }
216
217         if (last)
218                 virtqueue_kick(vblk->vq);
219
220         spin_unlock_irqrestore(&vblk->vq_lock, flags);
221         return BLK_MQ_RQ_QUEUE_OK;
222 }
223
224 /* return id (s/n) string for *disk to *id_str
225  */
226 static int virtblk_get_id(struct gendisk *disk, char *id_str)
227 {
228         struct virtio_blk *vblk = disk->private_data;
229         struct request *req;
230         struct bio *bio;
231         int err;
232
233         bio = bio_map_kern(vblk->disk->queue, id_str, VIRTIO_BLK_ID_BYTES,
234                            GFP_KERNEL);
235         if (IS_ERR(bio))
236                 return PTR_ERR(bio);
237
238         req = blk_make_request(vblk->disk->queue, bio, GFP_KERNEL);
239         if (IS_ERR(req)) {
240                 bio_put(bio);
241                 return PTR_ERR(req);
242         }
243
244         req->cmd_type = REQ_TYPE_SPECIAL;
245         err = blk_execute_rq(vblk->disk->queue, vblk->disk, req, false);
246         blk_put_request(req);
247
248         return err;
249 }
250
251 static int virtblk_ioctl(struct block_device *bdev, fmode_t mode,
252                              unsigned int cmd, unsigned long data)
253 {
254         struct gendisk *disk = bdev->bd_disk;
255         struct virtio_blk *vblk = disk->private_data;
256
257         /*
258          * Only allow the generic SCSI ioctls if the host can support it.
259          */
260         if (!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_SCSI))
261                 return -ENOTTY;
262
263         return scsi_cmd_blk_ioctl(bdev, mode, cmd,
264                                   (void __user *)data);
265 }
266
267 /* We provide getgeo only to please some old bootloader/partitioning tools */
268 static int virtblk_getgeo(struct block_device *bd, struct hd_geometry *geo)
269 {
270         struct virtio_blk *vblk = bd->bd_disk->private_data;
271
272         /* see if the host passed in geometry config */
273         if (virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_GEOMETRY)) {
274                 virtio_cread(vblk->vdev, struct virtio_blk_config,
275                              geometry.cylinders, &geo->cylinders);
276                 virtio_cread(vblk->vdev, struct virtio_blk_config,
277                              geometry.heads, &geo->heads);
278                 virtio_cread(vblk->vdev, struct virtio_blk_config,
279                              geometry.sectors, &geo->sectors);
280         } else {
281                 /* some standard values, similar to sd */
282                 geo->heads = 1 << 6;
283                 geo->sectors = 1 << 5;
284                 geo->cylinders = get_capacity(bd->bd_disk) >> 11;
285         }
286         return 0;
287 }
288
289 static const struct block_device_operations virtblk_fops = {
290         .ioctl  = virtblk_ioctl,
291         .owner  = THIS_MODULE,
292         .getgeo = virtblk_getgeo,
293 };
294
295 static int index_to_minor(int index)
296 {
297         return index << PART_BITS;
298 }
299
300 static int minor_to_index(int minor)
301 {
302         return minor >> PART_BITS;
303 }
304
305 static ssize_t virtblk_serial_show(struct device *dev,
306                                 struct device_attribute *attr, char *buf)
307 {
308         struct gendisk *disk = dev_to_disk(dev);
309         int err;
310
311         /* sysfs gives us a PAGE_SIZE buffer */
312         BUILD_BUG_ON(PAGE_SIZE < VIRTIO_BLK_ID_BYTES);
313
314         buf[VIRTIO_BLK_ID_BYTES] = '\0';
315         err = virtblk_get_id(disk, buf);
316         if (!err)
317                 return strlen(buf);
318
319         if (err == -EIO) /* Unsupported? Make it empty. */
320                 return 0;
321
322         return err;
323 }
324 DEVICE_ATTR(serial, S_IRUGO, virtblk_serial_show, NULL);
325
326 static void virtblk_config_changed_work(struct work_struct *work)
327 {
328         struct virtio_blk *vblk =
329                 container_of(work, struct virtio_blk, config_work);
330         struct virtio_device *vdev = vblk->vdev;
331         struct request_queue *q = vblk->disk->queue;
332         char cap_str_2[10], cap_str_10[10];
333         char *envp[] = { "RESIZE=1", NULL };
334         u64 capacity, size;
335
336         mutex_lock(&vblk->config_lock);
337         if (!vblk->config_enable)
338                 goto done;
339
340         /* Host must always specify the capacity. */
341         virtio_cread(vdev, struct virtio_blk_config, capacity, &capacity);
342
343         /* If capacity is too big, truncate with warning. */
344         if ((sector_t)capacity != capacity) {
345                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
346                          (unsigned long long)capacity);
347                 capacity = (sector_t)-1;
348         }
349
350         size = capacity * queue_logical_block_size(q);
351         string_get_size(size, STRING_UNITS_2, cap_str_2, sizeof(cap_str_2));
352         string_get_size(size, STRING_UNITS_10, cap_str_10, sizeof(cap_str_10));
353
354         dev_notice(&vdev->dev,
355                   "new size: %llu %d-byte logical blocks (%s/%s)\n",
356                   (unsigned long long)capacity,
357                   queue_logical_block_size(q),
358                   cap_str_10, cap_str_2);
359
360         set_capacity(vblk->disk, capacity);
361         revalidate_disk(vblk->disk);
362         kobject_uevent_env(&disk_to_dev(vblk->disk)->kobj, KOBJ_CHANGE, envp);
363 done:
364         mutex_unlock(&vblk->config_lock);
365 }
366
367 static void virtblk_config_changed(struct virtio_device *vdev)
368 {
369         struct virtio_blk *vblk = vdev->priv;
370
371         queue_work(virtblk_wq, &vblk->config_work);
372 }
373
374 static int init_vq(struct virtio_blk *vblk)
375 {
376         int err = 0;
377
378         /* We expect one virtqueue, for output. */
379         vblk->vq = virtio_find_single_vq(vblk->vdev, virtblk_done, "requests");
380         if (IS_ERR(vblk->vq))
381                 err = PTR_ERR(vblk->vq);
382
383         return err;
384 }
385
386 /*
387  * Legacy naming scheme used for virtio devices.  We are stuck with it for
388  * virtio blk but don't ever use it for any new driver.
389  */
390 static int virtblk_name_format(char *prefix, int index, char *buf, int buflen)
391 {
392         const int base = 'z' - 'a' + 1;
393         char *begin = buf + strlen(prefix);
394         char *end = buf + buflen;
395         char *p;
396         int unit;
397
398         p = end - 1;
399         *p = '\0';
400         unit = base;
401         do {
402                 if (p == begin)
403                         return -EINVAL;
404                 *--p = 'a' + (index % unit);
405                 index = (index / unit) - 1;
406         } while (index >= 0);
407
408         memmove(begin, p, end - p);
409         memcpy(buf, prefix, strlen(prefix));
410
411         return 0;
412 }
413
414 static int virtblk_get_cache_mode(struct virtio_device *vdev)
415 {
416         u8 writeback;
417         int err;
418
419         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_CONFIG_WCE,
420                                    struct virtio_blk_config, wce,
421                                    &writeback);
422         if (err)
423                 writeback = virtio_has_feature(vdev, VIRTIO_BLK_F_WCE);
424
425         return writeback;
426 }
427
428 static void virtblk_update_cache_mode(struct virtio_device *vdev)
429 {
430         u8 writeback = virtblk_get_cache_mode(vdev);
431         struct virtio_blk *vblk = vdev->priv;
432
433         if (writeback)
434                 blk_queue_flush(vblk->disk->queue, REQ_FLUSH);
435         else
436                 blk_queue_flush(vblk->disk->queue, 0);
437
438         revalidate_disk(vblk->disk);
439 }
440
441 static const char *const virtblk_cache_types[] = {
442         "write through", "write back"
443 };
444
445 static ssize_t
446 virtblk_cache_type_store(struct device *dev, struct device_attribute *attr,
447                          const char *buf, size_t count)
448 {
449         struct gendisk *disk = dev_to_disk(dev);
450         struct virtio_blk *vblk = disk->private_data;
451         struct virtio_device *vdev = vblk->vdev;
452         int i;
453
454         BUG_ON(!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_CONFIG_WCE));
455         for (i = ARRAY_SIZE(virtblk_cache_types); --i >= 0; )
456                 if (sysfs_streq(buf, virtblk_cache_types[i]))
457                         break;
458
459         if (i < 0)
460                 return -EINVAL;
461
462         virtio_cwrite8(vdev, offsetof(struct virtio_blk_config, wce), i);
463         virtblk_update_cache_mode(vdev);
464         return count;
465 }
466
467 static ssize_t
468 virtblk_cache_type_show(struct device *dev, struct device_attribute *attr,
469                          char *buf)
470 {
471         struct gendisk *disk = dev_to_disk(dev);
472         struct virtio_blk *vblk = disk->private_data;
473         u8 writeback = virtblk_get_cache_mode(vblk->vdev);
474
475         BUG_ON(writeback >= ARRAY_SIZE(virtblk_cache_types));
476         return snprintf(buf, 40, "%s\n", virtblk_cache_types[writeback]);
477 }
478
479 static const struct device_attribute dev_attr_cache_type_ro =
480         __ATTR(cache_type, S_IRUGO,
481                virtblk_cache_type_show, NULL);
482 static const struct device_attribute dev_attr_cache_type_rw =
483         __ATTR(cache_type, S_IRUGO|S_IWUSR,
484                virtblk_cache_type_show, virtblk_cache_type_store);
485
486 static int virtblk_init_request(void *data, struct request *rq,
487                 unsigned int hctx_idx, unsigned int request_idx,
488                 unsigned int numa_node)
489 {
490         struct virtio_blk *vblk = data;
491         struct virtblk_req *vbr = blk_mq_rq_to_pdu(rq);
492
493         sg_init_table(vbr->sg, vblk->sg_elems);
494         return 0;
495 }
496
497 static struct blk_mq_ops virtio_mq_ops = {
498         .queue_rq       = virtio_queue_rq,
499         .map_queue      = blk_mq_map_queue,
500         .complete       = virtblk_request_done,
501         .init_request   = virtblk_init_request,
502 };
503
504 static unsigned int virtblk_queue_depth;
505 module_param_named(queue_depth, virtblk_queue_depth, uint, 0444);
506
507 static int virtblk_probe(struct virtio_device *vdev)
508 {
509         struct virtio_blk *vblk;
510         struct request_queue *q;
511         int err, index;
512
513         u64 cap;
514         u32 v, blk_size, sg_elems, opt_io_size;
515         u16 min_io_size;
516         u8 physical_block_exp, alignment_offset;
517
518         err = ida_simple_get(&vd_index_ida, 0, minor_to_index(1 << MINORBITS),
519                              GFP_KERNEL);
520         if (err < 0)
521                 goto out;
522         index = err;
523
524         /* We need to know how many segments before we allocate. */
525         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_SEG_MAX,
526                                    struct virtio_blk_config, seg_max,
527                                    &sg_elems);
528
529         /* We need at least one SG element, whatever they say. */
530         if (err || !sg_elems)
531                 sg_elems = 1;
532
533         /* We need an extra sg elements at head and tail. */
534         sg_elems += 2;
535         vdev->priv = vblk = kmalloc(sizeof(*vblk), GFP_KERNEL);
536         if (!vblk) {
537                 err = -ENOMEM;
538                 goto out_free_index;
539         }
540
541         vblk->vdev = vdev;
542         vblk->sg_elems = sg_elems;
543         mutex_init(&vblk->config_lock);
544
545         INIT_WORK(&vblk->config_work, virtblk_config_changed_work);
546         vblk->config_enable = true;
547
548         err = init_vq(vblk);
549         if (err)
550                 goto out_free_vblk;
551         spin_lock_init(&vblk->vq_lock);
552
553         /* FIXME: How many partitions?  How long is a piece of string? */
554         vblk->disk = alloc_disk(1 << PART_BITS);
555         if (!vblk->disk) {
556                 err = -ENOMEM;
557                 goto out_free_vq;
558         }
559
560         /* Default queue sizing is to fill the ring. */
561         if (!virtblk_queue_depth) {
562                 virtblk_queue_depth = vblk->vq->num_free;
563                 /* ... but without indirect descs, we use 2 descs per req */
564                 if (!virtio_has_feature(vdev, VIRTIO_RING_F_INDIRECT_DESC))
565                         virtblk_queue_depth /= 2;
566         }
567
568         memset(&vblk->tag_set, 0, sizeof(vblk->tag_set));
569         vblk->tag_set.ops = &virtio_mq_ops;
570         vblk->tag_set.nr_hw_queues = 1;
571         vblk->tag_set.queue_depth = virtblk_queue_depth;
572         vblk->tag_set.numa_node = NUMA_NO_NODE;
573         vblk->tag_set.flags = BLK_MQ_F_SHOULD_MERGE;
574         vblk->tag_set.cmd_size =
575                 sizeof(struct virtblk_req) +
576                 sizeof(struct scatterlist) * sg_elems;
577         vblk->tag_set.driver_data = vblk;
578
579         err = blk_mq_alloc_tag_set(&vblk->tag_set);
580         if (err)
581                 goto out_put_disk;
582
583         q = vblk->disk->queue = blk_mq_init_queue(&vblk->tag_set);
584         if (!q) {
585                 err = -ENOMEM;
586                 goto out_free_tags;
587         }
588
589         q->queuedata = vblk;
590
591         virtblk_name_format("vd", index, vblk->disk->disk_name, DISK_NAME_LEN);
592
593         vblk->disk->major = major;
594         vblk->disk->first_minor = index_to_minor(index);
595         vblk->disk->private_data = vblk;
596         vblk->disk->fops = &virtblk_fops;
597         vblk->disk->driverfs_dev = &vdev->dev;
598         vblk->index = index;
599
600         /* configure queue flush support */
601         virtblk_update_cache_mode(vdev);
602
603         /* If disk is read-only in the host, the guest should obey */
604         if (virtio_has_feature(vdev, VIRTIO_BLK_F_RO))
605                 set_disk_ro(vblk->disk, 1);
606
607         /* Host must always specify the capacity. */
608         virtio_cread(vdev, struct virtio_blk_config, capacity, &cap);
609
610         /* If capacity is too big, truncate with warning. */
611         if ((sector_t)cap != cap) {
612                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
613                          (unsigned long long)cap);
614                 cap = (sector_t)-1;
615         }
616         set_capacity(vblk->disk, cap);
617
618         /* We can handle whatever the host told us to handle. */
619         blk_queue_max_segments(q, vblk->sg_elems-2);
620
621         /* No need to bounce any requests */
622         blk_queue_bounce_limit(q, BLK_BOUNCE_ANY);
623
624         /* No real sector limit. */
625         blk_queue_max_hw_sectors(q, -1U);
626
627         /* Host can optionally specify maximum segment size and number of
628          * segments. */
629         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_SIZE_MAX,
630                                    struct virtio_blk_config, size_max, &v);
631         if (!err)
632                 blk_queue_max_segment_size(q, v);
633         else
634                 blk_queue_max_segment_size(q, -1U);
635
636         /* Host can optionally specify the block size of the device */
637         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_BLK_SIZE,
638                                    struct virtio_blk_config, blk_size,
639                                    &blk_size);
640         if (!err)
641                 blk_queue_logical_block_size(q, blk_size);
642         else
643                 blk_size = queue_logical_block_size(q);
644
645         /* Use topology information if available */
646         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_TOPOLOGY,
647                                    struct virtio_blk_config, physical_block_exp,
648                                    &physical_block_exp);
649         if (!err && physical_block_exp)
650                 blk_queue_physical_block_size(q,
651                                 blk_size * (1 << physical_block_exp));
652
653         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_TOPOLOGY,
654                                    struct virtio_blk_config, alignment_offset,
655                                    &alignment_offset);
656         if (!err && alignment_offset)
657                 blk_queue_alignment_offset(q, blk_size * alignment_offset);
658
659         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_TOPOLOGY,
660                                    struct virtio_blk_config, min_io_size,
661                                    &min_io_size);
662         if (!err && min_io_size)
663                 blk_queue_io_min(q, blk_size * min_io_size);
664
665         err = virtio_cread_feature(vdev, VIRTIO_BLK_F_TOPOLOGY,
666                                    struct virtio_blk_config, opt_io_size,
667                                    &opt_io_size);
668         if (!err && opt_io_size)
669                 blk_queue_io_opt(q, blk_size * opt_io_size);
670
671         add_disk(vblk->disk);
672         err = device_create_file(disk_to_dev(vblk->disk), &dev_attr_serial);
673         if (err)
674                 goto out_del_disk;
675
676         if (virtio_has_feature(vdev, VIRTIO_BLK_F_CONFIG_WCE))
677                 err = device_create_file(disk_to_dev(vblk->disk),
678                                          &dev_attr_cache_type_rw);
679         else
680                 err = device_create_file(disk_to_dev(vblk->disk),
681                                          &dev_attr_cache_type_ro);
682         if (err)
683                 goto out_del_disk;
684         return 0;
685
686 out_del_disk:
687         del_gendisk(vblk->disk);
688         blk_cleanup_queue(vblk->disk->queue);
689 out_free_tags:
690         blk_mq_free_tag_set(&vblk->tag_set);
691 out_put_disk:
692         put_disk(vblk->disk);
693 out_free_vq:
694         vdev->config->del_vqs(vdev);
695 out_free_vblk:
696         kfree(vblk);
697 out_free_index:
698         ida_simple_remove(&vd_index_ida, index);
699 out:
700         return err;
701 }
702
703 static void virtblk_remove(struct virtio_device *vdev)
704 {
705         struct virtio_blk *vblk = vdev->priv;
706         int index = vblk->index;
707         int refc;
708
709         /* Prevent config work handler from accessing the device. */
710         mutex_lock(&vblk->config_lock);
711         vblk->config_enable = false;
712         mutex_unlock(&vblk->config_lock);
713
714         del_gendisk(vblk->disk);
715         blk_cleanup_queue(vblk->disk->queue);
716
717         blk_mq_free_tag_set(&vblk->tag_set);
718
719         /* Stop all the virtqueues. */
720         vdev->config->reset(vdev);
721
722         flush_work(&vblk->config_work);
723
724         refc = atomic_read(&disk_to_dev(vblk->disk)->kobj.kref.refcount);
725         put_disk(vblk->disk);
726         vdev->config->del_vqs(vdev);
727         kfree(vblk);
728
729         /* Only free device id if we don't have any users */
730         if (refc == 1)
731                 ida_simple_remove(&vd_index_ida, index);
732 }
733
734 #ifdef CONFIG_PM_SLEEP
735 static int virtblk_freeze(struct virtio_device *vdev)
736 {
737         struct virtio_blk *vblk = vdev->priv;
738
739         /* Ensure we don't receive any more interrupts */
740         vdev->config->reset(vdev);
741
742         /* Prevent config work handler from accessing the device. */
743         mutex_lock(&vblk->config_lock);
744         vblk->config_enable = false;
745         mutex_unlock(&vblk->config_lock);
746
747         flush_work(&vblk->config_work);
748
749         blk_mq_stop_hw_queues(vblk->disk->queue);
750
751         vdev->config->del_vqs(vdev);
752         return 0;
753 }
754
755 static int virtblk_restore(struct virtio_device *vdev)
756 {
757         struct virtio_blk *vblk = vdev->priv;
758         int ret;
759
760         vblk->config_enable = true;
761         ret = init_vq(vdev->priv);
762         if (!ret)
763                 blk_mq_start_stopped_hw_queues(vblk->disk->queue, true);
764
765         return ret;
766 }
767 #endif
768
769 static const struct virtio_device_id id_table[] = {
770         { VIRTIO_ID_BLOCK, VIRTIO_DEV_ANY_ID },
771         { 0 },
772 };
773
774 static unsigned int features[] = {
775         VIRTIO_BLK_F_SEG_MAX, VIRTIO_BLK_F_SIZE_MAX, VIRTIO_BLK_F_GEOMETRY,
776         VIRTIO_BLK_F_RO, VIRTIO_BLK_F_BLK_SIZE, VIRTIO_BLK_F_SCSI,
777         VIRTIO_BLK_F_WCE, VIRTIO_BLK_F_TOPOLOGY, VIRTIO_BLK_F_CONFIG_WCE
778 };
779
780 static struct virtio_driver virtio_blk = {
781         .feature_table          = features,
782         .feature_table_size     = ARRAY_SIZE(features),
783         .driver.name            = KBUILD_MODNAME,
784         .driver.owner           = THIS_MODULE,
785         .id_table               = id_table,
786         .probe                  = virtblk_probe,
787         .remove                 = virtblk_remove,
788         .config_changed         = virtblk_config_changed,
789 #ifdef CONFIG_PM_SLEEP
790         .freeze                 = virtblk_freeze,
791         .restore                = virtblk_restore,
792 #endif
793 };
794
795 static int __init init(void)
796 {
797         int error;
798
799         virtblk_wq = alloc_workqueue("virtio-blk", 0, 0);
800         if (!virtblk_wq)
801                 return -ENOMEM;
802
803         major = register_blkdev(0, "virtblk");
804         if (major < 0) {
805                 error = major;
806                 goto out_destroy_workqueue;
807         }
808
809         error = register_virtio_driver(&virtio_blk);
810         if (error)
811                 goto out_unregister_blkdev;
812         return 0;
813
814 out_unregister_blkdev:
815         unregister_blkdev(major, "virtblk");
816 out_destroy_workqueue:
817         destroy_workqueue(virtblk_wq);
818         return error;
819 }
820
821 static void __exit fini(void)
822 {
823         unregister_blkdev(major, "virtblk");
824         unregister_virtio_driver(&virtio_blk);
825         destroy_workqueue(virtblk_wq);
826 }
827 module_init(init);
828 module_exit(fini);
829
830 MODULE_DEVICE_TABLE(virtio, id_table);
831 MODULE_DESCRIPTION("Virtio block driver");
832 MODULE_LICENSE("GPL");