xref: /openbmc/qemu/hw/vfio/device.c (revision 59adfc6f1843538d78373296fd05a57ced1f3ecb)
168c07d76SCédric Le Goater /*
268c07d76SCédric Le Goater  * VFIO device
368c07d76SCédric Le Goater  *
468c07d76SCédric Le Goater  * Copyright Red Hat, Inc. 2012
568c07d76SCédric Le Goater  *
668c07d76SCédric Le Goater  * Authors:
768c07d76SCédric Le Goater  *  Alex Williamson <alex.williamson@redhat.com>
868c07d76SCédric Le Goater  *
968c07d76SCédric Le Goater  * This work is licensed under the terms of the GNU GPL, version 2.  See
1068c07d76SCédric Le Goater  * the COPYING file in the top-level directory.
1168c07d76SCédric Le Goater  *
1268c07d76SCédric Le Goater  * Based on qemu-kvm device-assignment:
1368c07d76SCédric Le Goater  *  Adapted for KVM by Qumranet.
1468c07d76SCédric Le Goater  *  Copyright (c) 2007, Neocleus, Alex Novik (alex@neocleus.com)
1568c07d76SCédric Le Goater  *  Copyright (c) 2007, Neocleus, Guy Zana (guy@neocleus.com)
1668c07d76SCédric Le Goater  *  Copyright (C) 2008, Qumranet, Amit Shah (amit.shah@qumranet.com)
1768c07d76SCédric Le Goater  *  Copyright (C) 2008, Red Hat, Amit Shah (amit.shah@redhat.com)
1868c07d76SCédric Le Goater  *  Copyright (C) 2008, IBM, Muli Ben-Yehuda (muli@il.ibm.com)
1968c07d76SCédric Le Goater  */
2068c07d76SCédric Le Goater 
2168c07d76SCédric Le Goater #include "qemu/osdep.h"
2268c07d76SCédric Le Goater #include <sys/ioctl.h>
2368c07d76SCédric Le Goater 
2411b8b9d5SCédric Le Goater #include "hw/vfio/vfio-device.h"
2568c07d76SCédric Le Goater #include "hw/vfio/pci.h"
2668c07d76SCédric Le Goater #include "hw/hw.h"
2768c07d76SCédric Le Goater #include "trace.h"
2868c07d76SCédric Le Goater #include "qapi/error.h"
2968c07d76SCédric Le Goater #include "qemu/error-report.h"
3068c07d76SCédric Le Goater #include "qemu/units.h"
3168c07d76SCédric Le Goater #include "monitor/monitor.h"
3268c07d76SCédric Le Goater #include "vfio-helpers.h"
3368c07d76SCédric Le Goater 
34a997b506SCédric Le Goater VFIODeviceList vfio_device_list =
35a997b506SCédric Le Goater     QLIST_HEAD_INITIALIZER(vfio_device_list);
36a997b506SCédric Le Goater 
3768c07d76SCédric Le Goater /*
38819a5865SCédric Le Goater  * We want to differentiate hot reset of multiple in-use devices vs
39819a5865SCédric Le Goater  * hot reset of a single in-use device. VFIO_DEVICE_RESET will already
40819a5865SCédric Le Goater  * handle the case of doing hot resets when there is only a single
41819a5865SCédric Le Goater  * device per bus. The in-use here refers to how many VFIODevices are
42819a5865SCédric Le Goater  * affected. A hot reset that affects multiple devices, but only a
43819a5865SCédric Le Goater  * single in-use device, means that we can call it from our bus
44819a5865SCédric Le Goater  * ->reset() callback since the extent is effectively a single
45819a5865SCédric Le Goater  * device. This allows us to make use of it in the hotplug path. When
46819a5865SCédric Le Goater  * there are multiple in-use devices, we can only trigger the hot
47819a5865SCédric Le Goater  * reset during a system reset and thus from our reset handler. We
48819a5865SCédric Le Goater  * separate _one vs _multi here so that we don't overlap and do a
49819a5865SCédric Le Goater  * double reset on the system reset path where both our reset handler
50819a5865SCédric Le Goater  * and ->reset() callback are used. Calling _one() will only do a hot
51819a5865SCédric Le Goater  * reset for the one in-use devices case, calling _multi() will do
52819a5865SCédric Le Goater  * nothing if a _one() would have been sufficient.
53819a5865SCédric Le Goater  */
54e218ccf0SCédric Le Goater void vfio_device_reset_handler(void *opaque)
55819a5865SCédric Le Goater {
56819a5865SCédric Le Goater     VFIODevice *vbasedev;
57819a5865SCédric Le Goater 
58e218ccf0SCédric Le Goater     trace_vfio_device_reset_handler();
59819a5865SCédric Le Goater     QLIST_FOREACH(vbasedev, &vfio_device_list, global_next) {
60819a5865SCédric Le Goater         if (vbasedev->dev->realized) {
61819a5865SCédric Le Goater             vbasedev->ops->vfio_compute_needs_reset(vbasedev);
62819a5865SCédric Le Goater         }
63819a5865SCédric Le Goater     }
64819a5865SCédric Le Goater 
65819a5865SCédric Le Goater     QLIST_FOREACH(vbasedev, &vfio_device_list, global_next) {
66819a5865SCédric Le Goater         if (vbasedev->dev->realized && vbasedev->needs_reset) {
67819a5865SCédric Le Goater             vbasedev->ops->vfio_hot_reset_multi(vbasedev);
68819a5865SCédric Le Goater         }
69819a5865SCédric Le Goater     }
70819a5865SCédric Le Goater }
71819a5865SCédric Le Goater 
72819a5865SCédric Le Goater /*
7368c07d76SCédric Le Goater  * Common VFIO interrupt disable
7468c07d76SCédric Le Goater  */
75e218ccf0SCédric Le Goater void vfio_device_irq_disable(VFIODevice *vbasedev, int index)
7668c07d76SCédric Le Goater {
7768c07d76SCédric Le Goater     struct vfio_irq_set irq_set = {
7868c07d76SCédric Le Goater         .argsz = sizeof(irq_set),
7968c07d76SCédric Le Goater         .flags = VFIO_IRQ_SET_DATA_NONE | VFIO_IRQ_SET_ACTION_TRIGGER,
8068c07d76SCédric Le Goater         .index = index,
8168c07d76SCédric Le Goater         .start = 0,
8268c07d76SCédric Le Goater         .count = 0,
8368c07d76SCédric Le Goater     };
8468c07d76SCédric Le Goater 
8538bf025dSJohn Levon     vbasedev->io_ops->set_irqs(vbasedev, &irq_set);
8668c07d76SCédric Le Goater }
8768c07d76SCédric Le Goater 
88e218ccf0SCédric Le Goater void vfio_device_irq_unmask(VFIODevice *vbasedev, int index)
8968c07d76SCédric Le Goater {
9068c07d76SCédric Le Goater     struct vfio_irq_set irq_set = {
9168c07d76SCédric Le Goater         .argsz = sizeof(irq_set),
9268c07d76SCédric Le Goater         .flags = VFIO_IRQ_SET_DATA_NONE | VFIO_IRQ_SET_ACTION_UNMASK,
9368c07d76SCédric Le Goater         .index = index,
9468c07d76SCédric Le Goater         .start = 0,
9568c07d76SCédric Le Goater         .count = 1,
9668c07d76SCédric Le Goater     };
9768c07d76SCédric Le Goater 
9838bf025dSJohn Levon     vbasedev->io_ops->set_irqs(vbasedev, &irq_set);
9968c07d76SCédric Le Goater }
10068c07d76SCédric Le Goater 
101e218ccf0SCédric Le Goater void vfio_device_irq_mask(VFIODevice *vbasedev, int index)
10268c07d76SCédric Le Goater {
10368c07d76SCédric Le Goater     struct vfio_irq_set irq_set = {
10468c07d76SCédric Le Goater         .argsz = sizeof(irq_set),
10568c07d76SCédric Le Goater         .flags = VFIO_IRQ_SET_DATA_NONE | VFIO_IRQ_SET_ACTION_MASK,
10668c07d76SCédric Le Goater         .index = index,
10768c07d76SCédric Le Goater         .start = 0,
10868c07d76SCédric Le Goater         .count = 1,
10968c07d76SCédric Le Goater     };
11068c07d76SCédric Le Goater 
11138bf025dSJohn Levon     vbasedev->io_ops->set_irqs(vbasedev, &irq_set);
11268c07d76SCédric Le Goater }
11368c07d76SCédric Le Goater 
11468c07d76SCédric Le Goater static inline const char *action_to_str(int action)
11568c07d76SCédric Le Goater {
11668c07d76SCédric Le Goater     switch (action) {
11768c07d76SCédric Le Goater     case VFIO_IRQ_SET_ACTION_MASK:
11868c07d76SCédric Le Goater         return "MASK";
11968c07d76SCédric Le Goater     case VFIO_IRQ_SET_ACTION_UNMASK:
12068c07d76SCédric Le Goater         return "UNMASK";
12168c07d76SCédric Le Goater     case VFIO_IRQ_SET_ACTION_TRIGGER:
12268c07d76SCédric Le Goater         return "TRIGGER";
12368c07d76SCédric Le Goater     default:
12468c07d76SCédric Le Goater         return "UNKNOWN ACTION";
12568c07d76SCédric Le Goater     }
12668c07d76SCédric Le Goater }
12768c07d76SCédric Le Goater 
12868c07d76SCédric Le Goater static const char *index_to_str(VFIODevice *vbasedev, int index)
12968c07d76SCédric Le Goater {
13068c07d76SCédric Le Goater     if (vbasedev->type != VFIO_DEVICE_TYPE_PCI) {
13168c07d76SCédric Le Goater         return NULL;
13268c07d76SCédric Le Goater     }
13368c07d76SCédric Le Goater 
13468c07d76SCédric Le Goater     switch (index) {
13568c07d76SCédric Le Goater     case VFIO_PCI_INTX_IRQ_INDEX:
13668c07d76SCédric Le Goater         return "INTX";
13768c07d76SCédric Le Goater     case VFIO_PCI_MSI_IRQ_INDEX:
13868c07d76SCédric Le Goater         return "MSI";
13968c07d76SCédric Le Goater     case VFIO_PCI_MSIX_IRQ_INDEX:
14068c07d76SCédric Le Goater         return "MSIX";
14168c07d76SCédric Le Goater     case VFIO_PCI_ERR_IRQ_INDEX:
14268c07d76SCédric Le Goater         return "ERR";
14368c07d76SCédric Le Goater     case VFIO_PCI_REQ_IRQ_INDEX:
14468c07d76SCédric Le Goater         return "REQ";
14568c07d76SCédric Le Goater     default:
14668c07d76SCédric Le Goater         return NULL;
14768c07d76SCédric Le Goater     }
14868c07d76SCédric Le Goater }
14968c07d76SCédric Le Goater 
150e218ccf0SCédric Le Goater bool vfio_device_irq_set_signaling(VFIODevice *vbasedev, int index, int subindex,
15168c07d76SCédric Le Goater                                    int action, int fd, Error **errp)
15268c07d76SCédric Le Goater {
15368c07d76SCédric Le Goater     ERRP_GUARD();
15468c07d76SCédric Le Goater     g_autofree struct vfio_irq_set *irq_set = NULL;
15568c07d76SCédric Le Goater     int argsz;
15668c07d76SCédric Le Goater     const char *name;
15768c07d76SCédric Le Goater     int32_t *pfd;
15868c07d76SCédric Le Goater 
15968c07d76SCédric Le Goater     argsz = sizeof(*irq_set) + sizeof(*pfd);
16068c07d76SCédric Le Goater 
16168c07d76SCédric Le Goater     irq_set = g_malloc0(argsz);
16268c07d76SCédric Le Goater     irq_set->argsz = argsz;
16368c07d76SCédric Le Goater     irq_set->flags = VFIO_IRQ_SET_DATA_EVENTFD | action;
16468c07d76SCédric Le Goater     irq_set->index = index;
16568c07d76SCédric Le Goater     irq_set->start = subindex;
16668c07d76SCédric Le Goater     irq_set->count = 1;
16768c07d76SCédric Le Goater     pfd = (int32_t *)&irq_set->data;
16868c07d76SCédric Le Goater     *pfd = fd;
16968c07d76SCédric Le Goater 
17038bf025dSJohn Levon     if (!vbasedev->io_ops->set_irqs(vbasedev, irq_set)) {
17168c07d76SCédric Le Goater         return true;
17268c07d76SCédric Le Goater     }
17368c07d76SCédric Le Goater 
17468c07d76SCédric Le Goater     error_setg_errno(errp, errno, "VFIO_DEVICE_SET_IRQS failure");
17568c07d76SCédric Le Goater 
17668c07d76SCédric Le Goater     name = index_to_str(vbasedev, index);
17768c07d76SCédric Le Goater     if (name) {
17868c07d76SCédric Le Goater         error_prepend(errp, "%s-%d: ", name, subindex);
17968c07d76SCédric Le Goater     } else {
18068c07d76SCédric Le Goater         error_prepend(errp, "index %d-%d: ", index, subindex);
18168c07d76SCédric Le Goater     }
18268c07d76SCédric Le Goater     error_prepend(errp,
18368c07d76SCédric Le Goater                   "Failed to %s %s eventfd signaling for interrupt ",
18468c07d76SCédric Le Goater                   fd < 0 ? "tear down" : "set up", action_to_str(action));
18568c07d76SCédric Le Goater     return false;
18668c07d76SCédric Le Goater }
18768c07d76SCédric Le Goater 
1885321e623SJohn Levon int vfio_device_get_irq_info(VFIODevice *vbasedev, int index,
1895321e623SJohn Levon                              struct vfio_irq_info *info)
1905321e623SJohn Levon {
1915321e623SJohn Levon     memset(info, 0, sizeof(*info));
1925321e623SJohn Levon 
1935321e623SJohn Levon     info->argsz = sizeof(*info);
1945321e623SJohn Levon     info->index = index;
1955321e623SJohn Levon 
19638bf025dSJohn Levon     return vbasedev->io_ops->get_irq_info(vbasedev, info);
1975321e623SJohn Levon }
1985321e623SJohn Levon 
199e218ccf0SCédric Le Goater int vfio_device_get_region_info(VFIODevice *vbasedev, int index,
20068c07d76SCédric Le Goater                                 struct vfio_region_info **info)
20168c07d76SCédric Le Goater {
20268c07d76SCédric Le Goater     size_t argsz = sizeof(struct vfio_region_info);
203*59adfc6fSJohn Levon     int fd = -1;
20438bf025dSJohn Levon     int ret;
20568c07d76SCédric Le Goater 
20695cdb024SJohn Levon     /* check cache */
20795cdb024SJohn Levon     if (vbasedev->reginfo[index] != NULL) {
20895cdb024SJohn Levon         *info = vbasedev->reginfo[index];
20995cdb024SJohn Levon         return 0;
21095cdb024SJohn Levon     }
21195cdb024SJohn Levon 
21268c07d76SCédric Le Goater     *info = g_malloc0(argsz);
21368c07d76SCédric Le Goater 
21468c07d76SCédric Le Goater     (*info)->index = index;
21568c07d76SCédric Le Goater retry:
21668c07d76SCédric Le Goater     (*info)->argsz = argsz;
21768c07d76SCédric Le Goater 
218*59adfc6fSJohn Levon     ret = vbasedev->io_ops->get_region_info(vbasedev, *info, &fd);
21938bf025dSJohn Levon     if (ret != 0) {
22068c07d76SCédric Le Goater         g_free(*info);
22168c07d76SCédric Le Goater         *info = NULL;
22238bf025dSJohn Levon         return ret;
22368c07d76SCédric Le Goater     }
22468c07d76SCédric Le Goater 
22568c07d76SCédric Le Goater     if ((*info)->argsz > argsz) {
22668c07d76SCédric Le Goater         argsz = (*info)->argsz;
22768c07d76SCédric Le Goater         *info = g_realloc(*info, argsz);
22868c07d76SCédric Le Goater 
229*59adfc6fSJohn Levon         if (fd != -1) {
230*59adfc6fSJohn Levon             close(fd);
231*59adfc6fSJohn Levon             fd = -1;
232*59adfc6fSJohn Levon         }
233*59adfc6fSJohn Levon 
23468c07d76SCédric Le Goater         goto retry;
23568c07d76SCédric Le Goater     }
23668c07d76SCédric Le Goater 
23795cdb024SJohn Levon     /* fill cache */
23895cdb024SJohn Levon     vbasedev->reginfo[index] = *info;
239*59adfc6fSJohn Levon     if (vbasedev->region_fds != NULL) {
240*59adfc6fSJohn Levon         vbasedev->region_fds[index] = fd;
241*59adfc6fSJohn Levon     }
24295cdb024SJohn Levon 
24368c07d76SCédric Le Goater     return 0;
24468c07d76SCédric Le Goater }
24568c07d76SCédric Le Goater 
246e218ccf0SCédric Le Goater int vfio_device_get_region_info_type(VFIODevice *vbasedev, uint32_t type,
24768c07d76SCédric Le Goater                                      uint32_t subtype, struct vfio_region_info **info)
24868c07d76SCédric Le Goater {
24968c07d76SCédric Le Goater     int i;
25068c07d76SCédric Le Goater 
25168c07d76SCédric Le Goater     for (i = 0; i < vbasedev->num_regions; i++) {
25268c07d76SCédric Le Goater         struct vfio_info_cap_header *hdr;
25368c07d76SCédric Le Goater         struct vfio_region_info_cap_type *cap_type;
25468c07d76SCédric Le Goater 
255e218ccf0SCédric Le Goater         if (vfio_device_get_region_info(vbasedev, i, info)) {
25668c07d76SCédric Le Goater             continue;
25768c07d76SCédric Le Goater         }
25868c07d76SCédric Le Goater 
25968c07d76SCédric Le Goater         hdr = vfio_get_region_info_cap(*info, VFIO_REGION_INFO_CAP_TYPE);
26068c07d76SCédric Le Goater         if (!hdr) {
26168c07d76SCédric Le Goater             continue;
26268c07d76SCédric Le Goater         }
26368c07d76SCédric Le Goater 
26468c07d76SCédric Le Goater         cap_type = container_of(hdr, struct vfio_region_info_cap_type, header);
26568c07d76SCédric Le Goater 
266e218ccf0SCédric Le Goater         trace_vfio_device_get_region_info_type(vbasedev->name, i,
26768c07d76SCédric Le Goater                                                cap_type->type, cap_type->subtype);
26868c07d76SCédric Le Goater 
26968c07d76SCédric Le Goater         if (cap_type->type == type && cap_type->subtype == subtype) {
27068c07d76SCédric Le Goater             return 0;
27168c07d76SCédric Le Goater         }
27268c07d76SCédric Le Goater     }
27368c07d76SCédric Le Goater 
27468c07d76SCédric Le Goater     *info = NULL;
27568c07d76SCédric Le Goater     return -ENODEV;
27668c07d76SCédric Le Goater }
27768c07d76SCédric Le Goater 
278e218ccf0SCédric Le Goater bool vfio_device_has_region_cap(VFIODevice *vbasedev, int region, uint16_t cap_type)
27968c07d76SCédric Le Goater {
28095cdb024SJohn Levon     struct vfio_region_info *info = NULL;
28168c07d76SCédric Le Goater     bool ret = false;
28268c07d76SCédric Le Goater 
283e218ccf0SCédric Le Goater     if (!vfio_device_get_region_info(vbasedev, region, &info)) {
28468c07d76SCédric Le Goater         if (vfio_get_region_info_cap(info, cap_type)) {
28568c07d76SCédric Le Goater             ret = true;
28668c07d76SCédric Le Goater         }
28768c07d76SCédric Le Goater     }
28868c07d76SCédric Le Goater 
28968c07d76SCédric Le Goater     return ret;
29068c07d76SCédric Le Goater }
29168c07d76SCédric Le Goater 
29268c07d76SCédric Le Goater bool vfio_device_get_name(VFIODevice *vbasedev, Error **errp)
29368c07d76SCédric Le Goater {
29468c07d76SCédric Le Goater     ERRP_GUARD();
29568c07d76SCédric Le Goater     struct stat st;
29668c07d76SCédric Le Goater 
29768c07d76SCédric Le Goater     if (vbasedev->fd < 0) {
29868c07d76SCédric Le Goater         if (stat(vbasedev->sysfsdev, &st) < 0) {
29968c07d76SCédric Le Goater             error_setg_errno(errp, errno, "no such host device");
30068c07d76SCédric Le Goater             error_prepend(errp, VFIO_MSG_PREFIX, vbasedev->sysfsdev);
30168c07d76SCédric Le Goater             return false;
30268c07d76SCédric Le Goater         }
30368c07d76SCédric Le Goater         /* User may specify a name, e.g: VFIO platform device */
30468c07d76SCédric Le Goater         if (!vbasedev->name) {
30568c07d76SCédric Le Goater             vbasedev->name = g_path_get_basename(vbasedev->sysfsdev);
30668c07d76SCédric Le Goater         }
30768c07d76SCédric Le Goater     } else {
30868c07d76SCédric Le Goater         if (!vbasedev->iommufd) {
30968c07d76SCédric Le Goater             error_setg(errp, "Use FD passing only with iommufd backend");
31068c07d76SCédric Le Goater             return false;
31168c07d76SCédric Le Goater         }
31268c07d76SCédric Le Goater         /*
31368c07d76SCédric Le Goater          * Give a name with fd so any function printing out vbasedev->name
31468c07d76SCédric Le Goater          * will not break.
31568c07d76SCédric Le Goater          */
31668c07d76SCédric Le Goater         if (!vbasedev->name) {
31768c07d76SCédric Le Goater             vbasedev->name = g_strdup_printf("VFIO_FD%d", vbasedev->fd);
31868c07d76SCédric Le Goater         }
31968c07d76SCédric Le Goater     }
32068c07d76SCédric Le Goater 
32168c07d76SCédric Le Goater     return true;
32268c07d76SCédric Le Goater }
32368c07d76SCédric Le Goater 
32468c07d76SCédric Le Goater void vfio_device_set_fd(VFIODevice *vbasedev, const char *str, Error **errp)
32568c07d76SCédric Le Goater {
32668c07d76SCédric Le Goater     ERRP_GUARD();
32768c07d76SCédric Le Goater     int fd = monitor_fd_param(monitor_cur(), str, errp);
32868c07d76SCédric Le Goater 
32968c07d76SCédric Le Goater     if (fd < 0) {
33068c07d76SCédric Le Goater         error_prepend(errp, "Could not parse remote object fd %s:", str);
33168c07d76SCédric Le Goater         return;
33268c07d76SCédric Le Goater     }
33368c07d76SCédric Le Goater     vbasedev->fd = fd;
33468c07d76SCédric Le Goater }
33568c07d76SCédric Le Goater 
33638bf025dSJohn Levon static VFIODeviceIOOps vfio_device_io_ops_ioctl;
33738bf025dSJohn Levon 
33868c07d76SCédric Le Goater void vfio_device_init(VFIODevice *vbasedev, int type, VFIODeviceOps *ops,
33968c07d76SCédric Le Goater                       DeviceState *dev, bool ram_discard)
34068c07d76SCédric Le Goater {
34168c07d76SCédric Le Goater     vbasedev->type = type;
34268c07d76SCédric Le Goater     vbasedev->ops = ops;
34338bf025dSJohn Levon     vbasedev->io_ops = &vfio_device_io_ops_ioctl;
34468c07d76SCédric Le Goater     vbasedev->dev = dev;
34568c07d76SCédric Le Goater     vbasedev->fd = -1;
346*59adfc6fSJohn Levon     vbasedev->use_region_fds = false;
34768c07d76SCédric Le Goater 
34868c07d76SCédric Le Goater     vbasedev->ram_block_discard_allowed = ram_discard;
34968c07d76SCédric Le Goater }
35068c07d76SCédric Le Goater 
35168c07d76SCédric Le Goater int vfio_device_get_aw_bits(VFIODevice *vdev)
35268c07d76SCédric Le Goater {
35368c07d76SCédric Le Goater     /*
35468c07d76SCédric Le Goater      * iova_ranges is a sorted list. For old kernels that support
35568c07d76SCédric Le Goater      * VFIO but not support query of iova ranges, iova_ranges is NULL,
35668c07d76SCédric Le Goater      * in this case HOST_IOMMU_DEVICE_CAP_AW_BITS_MAX(64) is returned.
35768c07d76SCédric Le Goater      */
35868c07d76SCédric Le Goater     GList *l = g_list_last(vdev->bcontainer->iova_ranges);
35968c07d76SCédric Le Goater 
36068c07d76SCédric Le Goater     if (l) {
36168c07d76SCédric Le Goater         Range *range = l->data;
36268c07d76SCédric Le Goater         return range_get_last_bit(range) + 1;
36368c07d76SCédric Le Goater     }
36468c07d76SCédric Le Goater 
36568c07d76SCédric Le Goater     return HOST_IOMMU_DEVICE_CAP_AW_BITS_MAX;
36668c07d76SCédric Le Goater }
36768c07d76SCédric Le Goater 
36868c07d76SCédric Le Goater bool vfio_device_is_mdev(VFIODevice *vbasedev)
36968c07d76SCédric Le Goater {
37068c07d76SCédric Le Goater     g_autofree char *subsys = NULL;
37168c07d76SCédric Le Goater     g_autofree char *tmp = NULL;
37268c07d76SCédric Le Goater 
37368c07d76SCédric Le Goater     if (!vbasedev->sysfsdev) {
37468c07d76SCédric Le Goater         return false;
37568c07d76SCédric Le Goater     }
37668c07d76SCédric Le Goater 
37768c07d76SCédric Le Goater     tmp = g_strdup_printf("%s/subsystem", vbasedev->sysfsdev);
37868c07d76SCédric Le Goater     subsys = realpath(tmp, NULL);
37968c07d76SCédric Le Goater     return subsys && (strcmp(subsys, "/sys/bus/mdev") == 0);
38068c07d76SCédric Le Goater }
38168c07d76SCédric Le Goater 
3820805f829SZhenzhong Duan bool vfio_device_hiod_create_and_realize(VFIODevice *vbasedev,
3830805f829SZhenzhong Duan                                          const char *typename, Error **errp)
38468c07d76SCédric Le Goater {
3850805f829SZhenzhong Duan     HostIOMMUDevice *hiod;
38668c07d76SCédric Le Goater 
3870805f829SZhenzhong Duan     if (vbasedev->mdev) {
38868c07d76SCédric Le Goater         return true;
38968c07d76SCédric Le Goater     }
39068c07d76SCédric Le Goater 
3910805f829SZhenzhong Duan     hiod = HOST_IOMMU_DEVICE(object_new(typename));
3920805f829SZhenzhong Duan 
3930805f829SZhenzhong Duan     if (!HOST_IOMMU_DEVICE_GET_CLASS(hiod)->realize(hiod, vbasedev, errp)) {
3940805f829SZhenzhong Duan         object_unref(hiod);
3950805f829SZhenzhong Duan         return false;
3960805f829SZhenzhong Duan     }
3970805f829SZhenzhong Duan 
3980805f829SZhenzhong Duan     vbasedev->hiod = hiod;
3990805f829SZhenzhong Duan     return true;
40068c07d76SCédric Le Goater }
40168c07d76SCédric Le Goater 
40268c07d76SCédric Le Goater VFIODevice *vfio_get_vfio_device(Object *obj)
40368c07d76SCédric Le Goater {
40468c07d76SCédric Le Goater     if (object_dynamic_cast(obj, TYPE_VFIO_PCI)) {
405d4e392d0SJohn Levon         return &VFIO_PCI_BASE(obj)->vbasedev;
40668c07d76SCédric Le Goater     } else {
40768c07d76SCédric Le Goater         return NULL;
40868c07d76SCédric Le Goater     }
40968c07d76SCédric Le Goater }
410923b1141SCédric Le Goater 
411ef73671fSJohn Levon bool vfio_device_attach_by_iommu_type(const char *iommu_type, char *name,
412ef73671fSJohn Levon                                       VFIODevice *vbasedev, AddressSpace *as,
413ef73671fSJohn Levon                                       Error **errp)
414923b1141SCédric Le Goater {
415923b1141SCédric Le Goater     const VFIOIOMMUClass *ops =
416ef73671fSJohn Levon         VFIO_IOMMU_CLASS(object_class_by_name(iommu_type));
417923b1141SCédric Le Goater 
418923b1141SCédric Le Goater     assert(ops);
419923b1141SCédric Le Goater 
4200805f829SZhenzhong Duan     return ops->attach_device(name, vbasedev, as, errp);
421923b1141SCédric Le Goater }
422923b1141SCédric Le Goater 
423ef73671fSJohn Levon bool vfio_device_attach(char *name, VFIODevice *vbasedev,
424ef73671fSJohn Levon                         AddressSpace *as, Error **errp)
425ef73671fSJohn Levon {
426ef73671fSJohn Levon     const char *iommu_type = vbasedev->iommufd ?
427ef73671fSJohn Levon                              TYPE_VFIO_IOMMU_IOMMUFD :
428ef73671fSJohn Levon                              TYPE_VFIO_IOMMU_LEGACY;
429ef73671fSJohn Levon 
430ef73671fSJohn Levon     return vfio_device_attach_by_iommu_type(iommu_type, name, vbasedev,
431ef73671fSJohn Levon                                             as, errp);
432ef73671fSJohn Levon }
433ef73671fSJohn Levon 
434e218ccf0SCédric Le Goater void vfio_device_detach(VFIODevice *vbasedev)
435923b1141SCédric Le Goater {
436923b1141SCédric Le Goater     if (!vbasedev->bcontainer) {
437923b1141SCédric Le Goater         return;
438923b1141SCédric Le Goater     }
439923b1141SCédric Le Goater     VFIO_IOMMU_GET_CLASS(vbasedev->bcontainer)->detach_device(vbasedev);
440923b1141SCédric Le Goater }
441a901682fSJohn Levon 
442a901682fSJohn Levon void vfio_device_prepare(VFIODevice *vbasedev, VFIOContainerBase *bcontainer,
443a901682fSJohn Levon                          struct vfio_device_info *info)
444a901682fSJohn Levon {
445a901682fSJohn Levon     vbasedev->num_irqs = info->num_irqs;
446a901682fSJohn Levon     vbasedev->num_regions = info->num_regions;
447a901682fSJohn Levon     vbasedev->flags = info->flags;
448a901682fSJohn Levon     vbasedev->reset_works = !!(info->flags & VFIO_DEVICE_FLAGS_RESET);
449a901682fSJohn Levon 
450a901682fSJohn Levon     vbasedev->bcontainer = bcontainer;
451a901682fSJohn Levon     QLIST_INSERT_HEAD(&bcontainer->device_list, vbasedev, container_next);
452a901682fSJohn Levon 
453a901682fSJohn Levon     QLIST_INSERT_HEAD(&vfio_device_list, vbasedev, global_next);
45495cdb024SJohn Levon 
45595cdb024SJohn Levon     vbasedev->reginfo = g_new0(struct vfio_region_info *,
45695cdb024SJohn Levon                                vbasedev->num_regions);
457*59adfc6fSJohn Levon     if (vbasedev->use_region_fds) {
458*59adfc6fSJohn Levon         vbasedev->region_fds = g_new0(int, vbasedev->num_regions);
459*59adfc6fSJohn Levon     }
460a901682fSJohn Levon }
461d60fb709SJohn Levon 
462d60fb709SJohn Levon void vfio_device_unprepare(VFIODevice *vbasedev)
463d60fb709SJohn Levon {
46495cdb024SJohn Levon     int i;
46595cdb024SJohn Levon 
46695cdb024SJohn Levon     for (i = 0; i < vbasedev->num_regions; i++) {
46795cdb024SJohn Levon         g_free(vbasedev->reginfo[i]);
468*59adfc6fSJohn Levon         if (vbasedev->region_fds != NULL && vbasedev->region_fds[i] != -1) {
469*59adfc6fSJohn Levon             close(vbasedev->region_fds[i]);
47095cdb024SJohn Levon         }
471*59adfc6fSJohn Levon 
472*59adfc6fSJohn Levon     }
473*59adfc6fSJohn Levon 
474*59adfc6fSJohn Levon     g_clear_pointer(&vbasedev->reginfo, g_free);
475*59adfc6fSJohn Levon     g_clear_pointer(&vbasedev->region_fds, g_free);
47695cdb024SJohn Levon 
477d60fb709SJohn Levon     QLIST_REMOVE(vbasedev, container_next);
478d60fb709SJohn Levon     QLIST_REMOVE(vbasedev, global_next);
479d60fb709SJohn Levon     vbasedev->bcontainer = NULL;
480d60fb709SJohn Levon }
48138bf025dSJohn Levon 
48238bf025dSJohn Levon /*
48338bf025dSJohn Levon  * Traditional ioctl() based io
48438bf025dSJohn Levon  */
48538bf025dSJohn Levon 
48638bf025dSJohn Levon static int vfio_device_io_device_feature(VFIODevice *vbasedev,
48738bf025dSJohn Levon                                          struct vfio_device_feature *feature)
48838bf025dSJohn Levon {
48938bf025dSJohn Levon     int ret;
49038bf025dSJohn Levon 
49138bf025dSJohn Levon     ret = ioctl(vbasedev->fd, VFIO_DEVICE_FEATURE, feature);
49238bf025dSJohn Levon 
49338bf025dSJohn Levon     return ret < 0 ? -errno : ret;
49438bf025dSJohn Levon }
49538bf025dSJohn Levon 
49638bf025dSJohn Levon static int vfio_device_io_get_region_info(VFIODevice *vbasedev,
497*59adfc6fSJohn Levon                                           struct vfio_region_info *info,
498*59adfc6fSJohn Levon                                           int *fd)
49938bf025dSJohn Levon {
50038bf025dSJohn Levon     int ret;
50138bf025dSJohn Levon 
502*59adfc6fSJohn Levon     *fd = -1;
503*59adfc6fSJohn Levon 
50438bf025dSJohn Levon     ret = ioctl(vbasedev->fd, VFIO_DEVICE_GET_REGION_INFO, info);
50538bf025dSJohn Levon 
50638bf025dSJohn Levon     return ret < 0 ? -errno : ret;
50738bf025dSJohn Levon }
50838bf025dSJohn Levon 
50938bf025dSJohn Levon static int vfio_device_io_get_irq_info(VFIODevice *vbasedev,
51038bf025dSJohn Levon                                        struct vfio_irq_info *info)
51138bf025dSJohn Levon {
51238bf025dSJohn Levon     int ret;
51338bf025dSJohn Levon 
51438bf025dSJohn Levon     ret = ioctl(vbasedev->fd, VFIO_DEVICE_GET_IRQ_INFO, info);
51538bf025dSJohn Levon 
51638bf025dSJohn Levon     return ret < 0 ? -errno : ret;
51738bf025dSJohn Levon }
51838bf025dSJohn Levon 
51938bf025dSJohn Levon static int vfio_device_io_set_irqs(VFIODevice *vbasedev,
52038bf025dSJohn Levon                                    struct vfio_irq_set *irqs)
52138bf025dSJohn Levon {
52238bf025dSJohn Levon     int ret;
52338bf025dSJohn Levon 
52438bf025dSJohn Levon     ret = ioctl(vbasedev->fd, VFIO_DEVICE_SET_IRQS, irqs);
52538bf025dSJohn Levon 
52638bf025dSJohn Levon     return ret < 0 ? -errno : ret;
52738bf025dSJohn Levon }
52838bf025dSJohn Levon 
529776066acSJohn Levon static int vfio_device_io_region_read(VFIODevice *vbasedev, uint8_t index,
530776066acSJohn Levon                                       off_t off, uint32_t size, void *data)
531776066acSJohn Levon {
532776066acSJohn Levon     struct vfio_region_info *info;
533776066acSJohn Levon     int ret;
534776066acSJohn Levon 
535776066acSJohn Levon     ret = vfio_device_get_region_info(vbasedev, index, &info);
536776066acSJohn Levon     if (ret != 0) {
537776066acSJohn Levon         return ret;
538776066acSJohn Levon     }
539776066acSJohn Levon 
540776066acSJohn Levon     ret = pread(vbasedev->fd, data, size, info->offset + off);
541776066acSJohn Levon 
542776066acSJohn Levon     return ret < 0 ? -errno : ret;
543776066acSJohn Levon }
544776066acSJohn Levon 
545776066acSJohn Levon static int vfio_device_io_region_write(VFIODevice *vbasedev, uint8_t index,
546776066acSJohn Levon                                        off_t off, uint32_t size, void *data)
547776066acSJohn Levon {
548776066acSJohn Levon     struct vfio_region_info *info;
549776066acSJohn Levon     int ret;
550776066acSJohn Levon 
551776066acSJohn Levon     ret = vfio_device_get_region_info(vbasedev, index, &info);
552776066acSJohn Levon     if (ret != 0) {
553776066acSJohn Levon         return ret;
554776066acSJohn Levon     }
555776066acSJohn Levon 
556776066acSJohn Levon     ret = pwrite(vbasedev->fd, data, size, info->offset + off);
557776066acSJohn Levon 
558776066acSJohn Levon     return ret < 0 ? -errno : ret;
559776066acSJohn Levon }
560776066acSJohn Levon 
56138bf025dSJohn Levon static VFIODeviceIOOps vfio_device_io_ops_ioctl = {
56238bf025dSJohn Levon     .device_feature = vfio_device_io_device_feature,
56338bf025dSJohn Levon     .get_region_info = vfio_device_io_get_region_info,
56438bf025dSJohn Levon     .get_irq_info = vfio_device_io_get_irq_info,
56538bf025dSJohn Levon     .set_irqs = vfio_device_io_set_irqs,
566776066acSJohn Levon     .region_read = vfio_device_io_region_read,
567776066acSJohn Levon     .region_write = vfio_device_io_region_write,
56838bf025dSJohn Levon };
569