i915/gvt/vgpu.c

82d375d1SZhi Wang/*
82d375d1SZhi Wang * Copyright(c) 2011-2016 Intel Corporation. All rights reserved.
82d375d1SZhi Wang *
82d375d1SZhi Wang * Permission is hereby granted, free of charge, to any person obtaining a
82d375d1SZhi Wang * copy of this software and associated documentation files (the "Software"),
82d375d1SZhi Wang * to deal in the Software without restriction, including without limitation
82d375d1SZhi Wang * the rights to use, copy, modify, merge, publish, distribute, sublicense,
82d375d1SZhi Wang * and/or sell copies of the Software, and to permit persons to whom the
82d375d1SZhi Wang * Software is furnished to do so, subject to the following conditions:
82d375d1SZhi Wang *
82d375d1SZhi Wang * The above copyright notice and this permission notice (including the next
82d375d1SZhi Wang * paragraph) shall be included in all copies or substantial portions of the
82d375d1SZhi Wang * Software.
82d375d1SZhi Wang *
82d375d1SZhi Wang * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
82d375d1SZhi Wang * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
82d375d1SZhi Wang * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
82d375d1SZhi Wang * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
82d375d1SZhi Wang * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
82d375d1SZhi Wang * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
82d375d1SZhi Wang * SOFTWARE.
82d375d1SZhi Wang *
82d375d1SZhi Wang * Authors:
82d375d1SZhi Wang *    Eddie Dong <eddie.dong@intel.com>
82d375d1SZhi Wang *    Kevin Tian <kevin.tian@intel.com>
82d375d1SZhi Wang *
82d375d1SZhi Wang * Contributors:
82d375d1SZhi Wang *    Ping Gao <ping.a.gao@intel.com>
82d375d1SZhi Wang *    Zhi Wang <zhi.a.wang@intel.com>
82d375d1SZhi Wang *    Bing Niu <bing.niu@intel.com>
82d375d1SZhi Wang *
82d375d1SZhi Wang */
82d375d1SZhi Wang
82d375d1SZhi Wang#include "i915_drv.h"
feddf6e8SZhenyu Wang#include "gvt.h"
feddf6e8SZhenyu Wang#include "i915_pvinfo.h"
82d375d1SZhi Wang
23736d1bSPing Gaovoid populate_pvinfo_page(struct intel_vgpu *vgpu)
82d375d1SZhi Wang{
82d375d1SZhi Wang	/* setup the ballooning information */
90551a12SZhenyu Wang	vgpu_vreg64_t(vgpu, vgtif_reg(magic)) = VGT_MAGIC;
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(version_major)) = 1;
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(version_minor)) = 0;
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(display_ready)) = 0;
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(vgt_id)) = vgpu->id;
a2ae95afSWeinan Li
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(vgt_caps)) = VGT_CAPS_FULL_48BIT_PPGTT;
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(vgt_caps)) |= VGT_CAPS_HWSP_EMULATION;
a2ae95afSWeinan Li
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(avail_rs.mappable_gmadr.base)) =
82d375d1SZhi Wang		vgpu_aperture_gmadr_base(vgpu);
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(avail_rs.mappable_gmadr.size)) =
82d375d1SZhi Wang		vgpu_aperture_sz(vgpu);
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(avail_rs.nonmappable_gmadr.base)) =
82d375d1SZhi Wang		vgpu_hidden_gmadr_base(vgpu);
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(avail_rs.nonmappable_gmadr.size)) =
82d375d1SZhi Wang		vgpu_hidden_sz(vgpu);
82d375d1SZhi Wang
90551a12SZhenyu Wang	vgpu_vreg_t(vgpu, vgtif_reg(avail_rs.fence_num)) = vgpu_fence_sz(vgpu);
82d375d1SZhi Wang
1c6ccad8STina Zhang	vgpu_vreg_t(vgpu, vgtif_reg(cursor_x_hot)) = UINT_MAX;
1c6ccad8STina Zhang	vgpu_vreg_t(vgpu, vgtif_reg(cursor_y_hot)) = UINT_MAX;
1c6ccad8STina Zhang
82d375d1SZhi Wang	gvt_dbg_core("Populate PVINFO PAGE for vGPU %d\n", vgpu->id);
82d375d1SZhi Wang	gvt_dbg_core("aperture base [GMADR] 0x%llx size 0x%llx\n",
82d375d1SZhi Wang		vgpu_aperture_gmadr_base(vgpu), vgpu_aperture_sz(vgpu));
82d375d1SZhi Wang	gvt_dbg_core("hidden base [GMADR] 0x%llx size=0x%llx\n",
82d375d1SZhi Wang		vgpu_hidden_gmadr_base(vgpu), vgpu_hidden_sz(vgpu));
82d375d1SZhi Wang	gvt_dbg_core("fence size %d\n", vgpu_fence_sz(vgpu));
82d375d1SZhi Wang
82d375d1SZhi Wang	WARN_ON(sizeof(struct vgt_if) != VGT_PVINFO_SIZE);
82d375d1SZhi Wang}
82d375d1SZhi Wang
bc90d097SPing Gao#define VGPU_MAX_WEIGHT 16
bc90d097SPing Gao#define VGPU_WEIGHT(vgpu_num)	\
bc90d097SPing Gao	(VGPU_MAX_WEIGHT / (vgpu_num))
bc90d097SPing Gao
191020b6SZhenyu Wangstatic struct {
191020b6SZhenyu Wang	unsigned int low_mm;
191020b6SZhenyu Wang	unsigned int high_mm;
191020b6SZhenyu Wang	unsigned int fence;
bc90d097SPing Gao
bc90d097SPing Gao	/* A vGPU with a weight of 8 will get twice as much GPU as a vGPU
bc90d097SPing Gao	 * with a weight of 4 on a contended host, different vGPU type has
bc90d097SPing Gao	 * different weight set. Legal weights range from 1 to 16.
bc90d097SPing Gao	 */
bc90d097SPing Gao	unsigned int weight;
d1a513beSZhenyu Wang	enum intel_vgpu_edid edid;
191020b6SZhenyu Wang	char *name;
191020b6SZhenyu Wang} vgpu_types[] = {
191020b6SZhenyu Wang/* Fixed vGPU type table */
bc90d097SPing Gao	{ MB_TO_BYTES(64), MB_TO_BYTES(384), 4, VGPU_WEIGHT(8), GVT_EDID_1024_768, "8" },
bc90d097SPing Gao	{ MB_TO_BYTES(128), MB_TO_BYTES(512), 4, VGPU_WEIGHT(4), GVT_EDID_1920_1200, "4" },
bc90d097SPing Gao	{ MB_TO_BYTES(256), MB_TO_BYTES(1024), 4, VGPU_WEIGHT(2), GVT_EDID_1920_1200, "2" },
bc90d097SPing Gao	{ MB_TO_BYTES(512), MB_TO_BYTES(2048), 4, VGPU_WEIGHT(1), GVT_EDID_1920_1200, "1" },
191020b6SZhenyu Wang};
191020b6SZhenyu Wang
82d375d1SZhi Wang/**
1f31c829SZhenyu Wang * intel_gvt_init_vgpu_types - initialize vGPU type list
1f31c829SZhenyu Wang * @gvt : GVT device
1f31c829SZhenyu Wang *
1f31c829SZhenyu Wang * Initialize vGPU type list based on available resource.
1f31c829SZhenyu Wang *
1f31c829SZhenyu Wang */
1f31c829SZhenyu Wangint intel_gvt_init_vgpu_types(struct intel_gvt *gvt)
1f31c829SZhenyu Wang{
1f31c829SZhenyu Wang	unsigned int num_types;
2d6ceb8eSZhenyu Wang	unsigned int i, low_avail, high_avail;
1f31c829SZhenyu Wang	unsigned int min_low;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	/* vGPU type name is defined as GVTg_Vx_y which contains
191020b6SZhenyu Wang	 * physical GPU generation type (e.g V4 as BDW server, V5 as
191020b6SZhenyu Wang	 * SKL server).
1f31c829SZhenyu Wang	 *
1f31c829SZhenyu Wang	 * Depend on physical SKU resource, might see vGPU types like
1f31c829SZhenyu Wang	 * GVTg_V4_8, GVTg_V4_4, GVTg_V4_2, etc. We can create
1f31c829SZhenyu Wang	 * different types of vGPU on same physical GPU depending on
1f31c829SZhenyu Wang	 * available resource. Each vGPU type will have "avail_instance"
1f31c829SZhenyu Wang	 * to indicate how many vGPU instance can be created for this
1f31c829SZhenyu Wang	 * type.
1f31c829SZhenyu Wang	 *
1f31c829SZhenyu Wang	 */
2d6ceb8eSZhenyu Wang	low_avail = gvt_aperture_sz(gvt) - HOST_LOW_GM_SIZE;
2d6ceb8eSZhenyu Wang	high_avail = gvt_hidden_sz(gvt) - HOST_HIGH_GM_SIZE;
191020b6SZhenyu Wang	num_types = sizeof(vgpu_types) / sizeof(vgpu_types[0]);
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	gvt->types = kzalloc(num_types * sizeof(struct intel_vgpu_type),
1f31c829SZhenyu Wang			     GFP_KERNEL);
1f31c829SZhenyu Wang	if (!gvt->types)
1f31c829SZhenyu Wang		return -ENOMEM;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	min_low = MB_TO_BYTES(32);
1f31c829SZhenyu Wang	for (i = 0; i < num_types; ++i) {
191020b6SZhenyu Wang		if (low_avail / vgpu_types[i].low_mm == 0)
1f31c829SZhenyu Wang			break;
191020b6SZhenyu Wang
191020b6SZhenyu Wang		gvt->types[i].low_gm_size = vgpu_types[i].low_mm;
191020b6SZhenyu Wang		gvt->types[i].high_gm_size = vgpu_types[i].high_mm;
191020b6SZhenyu Wang		gvt->types[i].fence = vgpu_types[i].fence;
bc90d097SPing Gao
bc90d097SPing Gao		if (vgpu_types[i].weight < 1 ||
bc90d097SPing Gao					vgpu_types[i].weight > VGPU_MAX_WEIGHT)
bc90d097SPing Gao			return -EINVAL;
bc90d097SPing Gao
bc90d097SPing Gao		gvt->types[i].weight = vgpu_types[i].weight;
d1a513beSZhenyu Wang		gvt->types[i].resolution = vgpu_types[i].edid;
191020b6SZhenyu Wang		gvt->types[i].avail_instance = min(low_avail / vgpu_types[i].low_mm,
191020b6SZhenyu Wang						   high_avail / vgpu_types[i].high_mm);
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang		if (IS_GEN8(gvt->dev_priv))
191020b6SZhenyu Wang			sprintf(gvt->types[i].name, "GVTg_V4_%s",
191020b6SZhenyu Wang						vgpu_types[i].name);
1f31c829SZhenyu Wang		else if (IS_GEN9(gvt->dev_priv))
191020b6SZhenyu Wang			sprintf(gvt->types[i].name, "GVTg_V5_%s",
191020b6SZhenyu Wang						vgpu_types[i].name);
1f31c829SZhenyu Wang
bc90d097SPing Gao		gvt_dbg_core("type[%d]: %s avail %u low %u high %u fence %u weight %u res %s\n",
191020b6SZhenyu Wang			     i, gvt->types[i].name,
1f31c829SZhenyu Wang			     gvt->types[i].avail_instance,
1f31c829SZhenyu Wang			     gvt->types[i].low_gm_size,
d1a513beSZhenyu Wang			     gvt->types[i].high_gm_size, gvt->types[i].fence,
bc90d097SPing Gao			     gvt->types[i].weight,
d1a513beSZhenyu Wang			     vgpu_edid_str(gvt->types[i].resolution));
1f31c829SZhenyu Wang	}
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	gvt->num_types = i;
1f31c829SZhenyu Wang	return 0;
1f31c829SZhenyu Wang}
1f31c829SZhenyu Wang
1f31c829SZhenyu Wangvoid intel_gvt_clean_vgpu_types(struct intel_gvt *gvt)
1f31c829SZhenyu Wang{
1f31c829SZhenyu Wang	kfree(gvt->types);
1f31c829SZhenyu Wang}
1f31c829SZhenyu Wang
1f31c829SZhenyu Wangstatic void intel_gvt_update_vgpu_types(struct intel_gvt *gvt)
1f31c829SZhenyu Wang{
1f31c829SZhenyu Wang	int i;
1f31c829SZhenyu Wang	unsigned int low_gm_avail, high_gm_avail, fence_avail;
191020b6SZhenyu Wang	unsigned int low_gm_min, high_gm_min, fence_min;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	/* Need to depend on maxium hw resource size but keep on
1f31c829SZhenyu Wang	 * static config for now.
1f31c829SZhenyu Wang	 */
2d6ceb8eSZhenyu Wang	low_gm_avail = gvt_aperture_sz(gvt) - HOST_LOW_GM_SIZE -
1f31c829SZhenyu Wang		gvt->gm.vgpu_allocated_low_gm_size;
2d6ceb8eSZhenyu Wang	high_gm_avail = gvt_hidden_sz(gvt) - HOST_HIGH_GM_SIZE -
1f31c829SZhenyu Wang		gvt->gm.vgpu_allocated_high_gm_size;
1f31c829SZhenyu Wang	fence_avail = gvt_fence_sz(gvt) - HOST_FENCE -
1f31c829SZhenyu Wang		gvt->fence.vgpu_allocated_fence_num;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	for (i = 0; i < gvt->num_types; i++) {
1f31c829SZhenyu Wang		low_gm_min = low_gm_avail / gvt->types[i].low_gm_size;
1f31c829SZhenyu Wang		high_gm_min = high_gm_avail / gvt->types[i].high_gm_size;
1f31c829SZhenyu Wang		fence_min = fence_avail / gvt->types[i].fence;
191020b6SZhenyu Wang		gvt->types[i].avail_instance = min(min(low_gm_min, high_gm_min),
191020b6SZhenyu Wang						   fence_min);
1f31c829SZhenyu Wang
191020b6SZhenyu Wang		gvt_dbg_core("update type[%d]: %s avail %u low %u high %u fence %u\n",
191020b6SZhenyu Wang		       i, gvt->types[i].name,
1f31c829SZhenyu Wang		       gvt->types[i].avail_instance, gvt->types[i].low_gm_size,
1f31c829SZhenyu Wang		       gvt->types[i].high_gm_size, gvt->types[i].fence);
1f31c829SZhenyu Wang	}
1f31c829SZhenyu Wang}
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang/**
b79c52aeSZhi Wang * intel_gvt_active_vgpu - activate a virtual GPU
b79c52aeSZhi Wang * @vgpu: virtual GPU
b79c52aeSZhi Wang *
b79c52aeSZhi Wang * This function is called when user wants to activate a virtual GPU.
b79c52aeSZhi Wang *
b79c52aeSZhi Wang */
b79c52aeSZhi Wangvoid intel_gvt_activate_vgpu(struct intel_vgpu *vgpu)
b79c52aeSZhi Wang{
b79c52aeSZhi Wang	mutex_lock(&vgpu->gvt->lock);
b79c52aeSZhi Wang	vgpu->active = true;
b79c52aeSZhi Wang	mutex_unlock(&vgpu->gvt->lock);
b79c52aeSZhi Wang}
b79c52aeSZhi Wang
b79c52aeSZhi Wang/**
b79c52aeSZhi Wang * intel_gvt_deactive_vgpu - deactivate a virtual GPU
b79c52aeSZhi Wang * @vgpu: virtual GPU
b79c52aeSZhi Wang *
b79c52aeSZhi Wang * This function is called when user wants to deactivate a virtual GPU.
b79c52aeSZhi Wang * All virtual GPU runtime information will be destroyed.
b79c52aeSZhi Wang *
b79c52aeSZhi Wang */
b79c52aeSZhi Wangvoid intel_gvt_deactivate_vgpu(struct intel_vgpu *vgpu)
b79c52aeSZhi Wang{
f25a49abSColin Xu	mutex_lock(&vgpu->vgpu_lock);
b79c52aeSZhi Wang
b79c52aeSZhi Wang	vgpu->active = false;
b79c52aeSZhi Wang
1406a14bSZhi Wang	if (atomic_read(&vgpu->submission.running_workload_num)) {
f25a49abSColin Xu		mutex_unlock(&vgpu->vgpu_lock);
b79c52aeSZhi Wang		intel_gvt_wait_vgpu_idle(vgpu);
f25a49abSColin Xu		mutex_lock(&vgpu->vgpu_lock);
b79c52aeSZhi Wang	}
b79c52aeSZhi Wang
b79c52aeSZhi Wang	intel_vgpu_stop_schedule(vgpu);
e546e281STina Zhang	intel_vgpu_dmabuf_cleanup(vgpu);
b79c52aeSZhi Wang
f25a49abSColin Xu	mutex_unlock(&vgpu->vgpu_lock);
b79c52aeSZhi Wang}
b79c52aeSZhi Wang
b79c52aeSZhi Wang/**
82d375d1SZhi Wang * intel_gvt_destroy_vgpu - destroy a virtual GPU
82d375d1SZhi Wang * @vgpu: virtual GPU
82d375d1SZhi Wang *
82d375d1SZhi Wang * This function is called when user wants to destroy a virtual GPU.
82d375d1SZhi Wang *
82d375d1SZhi Wang */
82d375d1SZhi Wangvoid intel_gvt_destroy_vgpu(struct intel_vgpu *vgpu)
82d375d1SZhi Wang{
82d375d1SZhi Wang	struct intel_gvt *gvt = vgpu->gvt;
82d375d1SZhi Wang
f25a49abSColin Xu	mutex_lock(&vgpu->vgpu_lock);
82d375d1SZhi Wang
b79c52aeSZhi Wang	WARN(vgpu->active, "vGPU is still active!\n");
b79c52aeSZhi Wang
bc7b0be3SChangbin Du	intel_gvt_debugfs_remove_vgpu(vgpu);
4b63960eSZhi Wang	intel_vgpu_clean_sched_policy(vgpu);
874b6a91SZhi Wang	intel_vgpu_clean_submission(vgpu);
04d348aeSZhi Wang	intel_vgpu_clean_display(vgpu);
4d60c5fdSZhi Wang	intel_vgpu_clean_opregion(vgpu);
2707e444SZhi Wang	intel_vgpu_clean_gtt(vgpu);
82d375d1SZhi Wang	intel_gvt_hypervisor_detach_vgpu(vgpu);
82d375d1SZhi Wang	intel_vgpu_free_resource(vgpu);
cdcc4347SChangbin Du	intel_vgpu_clean_mmio(vgpu);
e546e281STina Zhang	intel_vgpu_dmabuf_cleanup(vgpu);
f25a49abSColin Xu	mutex_unlock(&vgpu->vgpu_lock);
82d375d1SZhi Wang
f25a49abSColin Xu	mutex_lock(&gvt->lock);
f25a49abSColin Xu	idr_remove(&gvt->vgpu_idr, vgpu->id);
f25a49abSColin Xu	if (idr_is_empty(&gvt->vgpu_idr))
f25a49abSColin Xu		intel_gvt_clean_irq(gvt);
1f31c829SZhenyu Wang	intel_gvt_update_vgpu_types(gvt);
82d375d1SZhi Wang	mutex_unlock(&gvt->lock);
f25a49abSColin Xu
f25a49abSColin Xu	vfree(vgpu);
82d375d1SZhi Wang}
82d375d1SZhi Wang
afe04fbeSPing Gao#define IDLE_VGPU_IDR 0
afe04fbeSPing Gao
afe04fbeSPing Gao/**
afe04fbeSPing Gao * intel_gvt_create_idle_vgpu - create an idle virtual GPU
afe04fbeSPing Gao * @gvt: GVT device
afe04fbeSPing Gao *
afe04fbeSPing Gao * This function is called when user wants to create an idle virtual GPU.
afe04fbeSPing Gao *
afe04fbeSPing Gao * Returns:
afe04fbeSPing Gao * pointer to intel_vgpu, error pointer if failed.
afe04fbeSPing Gao */
afe04fbeSPing Gaostruct intel_vgpu *intel_gvt_create_idle_vgpu(struct intel_gvt *gvt)
afe04fbeSPing Gao{
afe04fbeSPing Gao	struct intel_vgpu *vgpu;
afe04fbeSPing Gao	enum intel_engine_id i;
afe04fbeSPing Gao	int ret;
afe04fbeSPing Gao
afe04fbeSPing Gao	vgpu = vzalloc(sizeof(*vgpu));
afe04fbeSPing Gao	if (!vgpu)
afe04fbeSPing Gao		return ERR_PTR(-ENOMEM);
afe04fbeSPing Gao
afe04fbeSPing Gao	vgpu->id = IDLE_VGPU_IDR;
afe04fbeSPing Gao	vgpu->gvt = gvt;
f25a49abSColin Xu	mutex_init(&vgpu->vgpu_lock);
afe04fbeSPing Gao
afe04fbeSPing Gao	for (i = 0; i < I915_NUM_ENGINES; i++)
1406a14bSZhi Wang		INIT_LIST_HEAD(&vgpu->submission.workload_q_head[i]);
afe04fbeSPing Gao
afe04fbeSPing Gao	ret = intel_vgpu_init_sched_policy(vgpu);
afe04fbeSPing Gao	if (ret)
afe04fbeSPing Gao		goto out_free_vgpu;
afe04fbeSPing Gao
afe04fbeSPing Gao	vgpu->active = false;
afe04fbeSPing Gao
afe04fbeSPing Gao	return vgpu;
afe04fbeSPing Gao
afe04fbeSPing Gaoout_free_vgpu:
afe04fbeSPing Gao	vfree(vgpu);
afe04fbeSPing Gao	return ERR_PTR(ret);
afe04fbeSPing Gao}
afe04fbeSPing Gao
afe04fbeSPing Gao/**
afe04fbeSPing Gao * intel_gvt_destroy_vgpu - destroy an idle virtual GPU
afe04fbeSPing Gao * @vgpu: virtual GPU
afe04fbeSPing Gao *
afe04fbeSPing Gao * This function is called when user wants to destroy an idle virtual GPU.
afe04fbeSPing Gao *
afe04fbeSPing Gao */
afe04fbeSPing Gaovoid intel_gvt_destroy_idle_vgpu(struct intel_vgpu *vgpu)
afe04fbeSPing Gao{
f25a49abSColin Xu	mutex_lock(&vgpu->vgpu_lock);
afe04fbeSPing Gao	intel_vgpu_clean_sched_policy(vgpu);
f25a49abSColin Xu	mutex_unlock(&vgpu->vgpu_lock);
f25a49abSColin Xu
afe04fbeSPing Gao	vfree(vgpu);
afe04fbeSPing Gao}
afe04fbeSPing Gao
1f31c829SZhenyu Wangstatic struct intel_vgpu *__intel_gvt_create_vgpu(struct intel_gvt *gvt,
82d375d1SZhi Wang		struct intel_vgpu_creation_params *param)
82d375d1SZhi Wang{
82d375d1SZhi Wang	struct intel_vgpu *vgpu;
82d375d1SZhi Wang	int ret;
82d375d1SZhi Wang
82d375d1SZhi Wang	gvt_dbg_core("handle %llu low %llu MB high %llu MB fence %llu\n",
82d375d1SZhi Wang			param->handle, param->low_gm_sz, param->high_gm_sz,
82d375d1SZhi Wang			param->fence_sz);
82d375d1SZhi Wang
82d375d1SZhi Wang	vgpu = vzalloc(sizeof(*vgpu));
82d375d1SZhi Wang	if (!vgpu)
82d375d1SZhi Wang		return ERR_PTR(-ENOMEM);
82d375d1SZhi Wang
afe04fbeSPing Gao	ret = idr_alloc(&gvt->vgpu_idr, vgpu, IDLE_VGPU_IDR + 1, GVT_MAX_VGPU,
afe04fbeSPing Gao		GFP_KERNEL);
82d375d1SZhi Wang	if (ret < 0)
82d375d1SZhi Wang		goto out_free_vgpu;
82d375d1SZhi Wang
82d375d1SZhi Wang	vgpu->id = ret;
82d375d1SZhi Wang	vgpu->handle = param->handle;
82d375d1SZhi Wang	vgpu->gvt = gvt;
bc90d097SPing Gao	vgpu->sched_ctl.weight = param->weight;
f25a49abSColin Xu	mutex_init(&vgpu->vgpu_lock);
e546e281STina Zhang	INIT_LIST_HEAD(&vgpu->dmabuf_obj_list_head);
e502a2afSChangbin Du	INIT_RADIX_TREE(&vgpu->page_track_tree, GFP_KERNEL);
e546e281STina Zhang	idr_init(&vgpu->object_idr);
536fc234SChangbin Du	intel_vgpu_init_cfg_space(vgpu, param->primary);
82d375d1SZhi Wang
cdcc4347SChangbin Du	ret = intel_vgpu_init_mmio(vgpu);
82d375d1SZhi Wang	if (ret)
4e537891SJike Song		goto out_clean_idr;
82d375d1SZhi Wang
82d375d1SZhi Wang	ret = intel_vgpu_alloc_resource(vgpu, param);
82d375d1SZhi Wang	if (ret)
82d375d1SZhi Wang		goto out_clean_vgpu_mmio;
82d375d1SZhi Wang
82d375d1SZhi Wang	populate_pvinfo_page(vgpu);
82d375d1SZhi Wang
82d375d1SZhi Wang	ret = intel_gvt_hypervisor_attach_vgpu(vgpu);
82d375d1SZhi Wang	if (ret)
82d375d1SZhi Wang		goto out_clean_vgpu_resource;
82d375d1SZhi Wang
2707e444SZhi Wang	ret = intel_vgpu_init_gtt(vgpu);
2707e444SZhi Wang	if (ret)
2707e444SZhi Wang		goto out_detach_hypervisor_vgpu;
2707e444SZhi Wang
4dff110bSXiong Zhang	ret = intel_vgpu_init_opregion(vgpu);
04d348aeSZhi Wang	if (ret)
8f89743bSJike Song		goto out_clean_gtt;
04d348aeSZhi Wang
4dff110bSXiong Zhang	ret = intel_vgpu_init_display(vgpu, param->resolution);
4dff110bSXiong Zhang	if (ret)
4dff110bSXiong Zhang		goto out_clean_opregion;
4dff110bSXiong Zhang
ad1d3636SZhi Wang	ret = intel_vgpu_setup_submission(vgpu);
8453d674SZhi Wang	if (ret)
8453d674SZhi Wang		goto out_clean_display;
8453d674SZhi Wang
4b63960eSZhi Wang	ret = intel_vgpu_init_sched_policy(vgpu);
4b63960eSZhi Wang	if (ret)
ad1d3636SZhi Wang		goto out_clean_submission;
4b63960eSZhi Wang
bc7b0be3SChangbin Du	ret = intel_gvt_debugfs_add_vgpu(vgpu);
bc7b0be3SChangbin Du	if (ret)
bc7b0be3SChangbin Du		goto out_clean_sched_policy;
bc7b0be3SChangbin Du
b851adeaSTina Zhang	ret = intel_gvt_hypervisor_set_opregion(vgpu);
b851adeaSTina Zhang	if (ret)
b851adeaSTina Zhang		goto out_clean_sched_policy;
b851adeaSTina Zhang
82d375d1SZhi Wang	return vgpu;
82d375d1SZhi Wang
bc7b0be3SChangbin Duout_clean_sched_policy:
bc7b0be3SChangbin Du	intel_vgpu_clean_sched_policy(vgpu);
ad1d3636SZhi Wangout_clean_submission:
874b6a91SZhi Wang	intel_vgpu_clean_submission(vgpu);
8453d674SZhi Wangout_clean_display:
8453d674SZhi Wang	intel_vgpu_clean_display(vgpu);
4dff110bSXiong Zhangout_clean_opregion:
4dff110bSXiong Zhang	intel_vgpu_clean_opregion(vgpu);
4d60c5fdSZhi Wangout_clean_gtt:
4d60c5fdSZhi Wang	intel_vgpu_clean_gtt(vgpu);
2707e444SZhi Wangout_detach_hypervisor_vgpu:
2707e444SZhi Wang	intel_gvt_hypervisor_detach_vgpu(vgpu);
82d375d1SZhi Wangout_clean_vgpu_resource:
82d375d1SZhi Wang	intel_vgpu_free_resource(vgpu);
82d375d1SZhi Wangout_clean_vgpu_mmio:
cdcc4347SChangbin Du	intel_vgpu_clean_mmio(vgpu);
4e537891SJike Songout_clean_idr:
4e537891SJike Song	idr_remove(&gvt->vgpu_idr, vgpu->id);
82d375d1SZhi Wangout_free_vgpu:
82d375d1SZhi Wang	vfree(vgpu);
82d375d1SZhi Wang	return ERR_PTR(ret);
82d375d1SZhi Wang}
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang/**
1f31c829SZhenyu Wang * intel_gvt_create_vgpu - create a virtual GPU
1f31c829SZhenyu Wang * @gvt: GVT device
1f31c829SZhenyu Wang * @type: type of the vGPU to create
1f31c829SZhenyu Wang *
1f31c829SZhenyu Wang * This function is called when user wants to create a virtual GPU.
1f31c829SZhenyu Wang *
1f31c829SZhenyu Wang * Returns:
1f31c829SZhenyu Wang * pointer to intel_vgpu, error pointer if failed.
1f31c829SZhenyu Wang */
1f31c829SZhenyu Wangstruct intel_vgpu *intel_gvt_create_vgpu(struct intel_gvt *gvt,
1f31c829SZhenyu Wang				struct intel_vgpu_type *type)
1f31c829SZhenyu Wang{
1f31c829SZhenyu Wang	struct intel_vgpu_creation_params param;
1f31c829SZhenyu Wang	struct intel_vgpu *vgpu;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	param.handle = 0;
e992faeeSDu, Changbin	param.primary = 1;
1f31c829SZhenyu Wang	param.low_gm_sz = type->low_gm_size;
1f31c829SZhenyu Wang	param.high_gm_sz = type->high_gm_size;
1f31c829SZhenyu Wang	param.fence_sz = type->fence;
bc90d097SPing Gao	param.weight = type->weight;
d1a513beSZhenyu Wang	param.resolution = type->resolution;
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	/* XXX current param based on MB */
1f31c829SZhenyu Wang	param.low_gm_sz = BYTES_TO_MB(param.low_gm_sz);
1f31c829SZhenyu Wang	param.high_gm_sz = BYTES_TO_MB(param.high_gm_sz);
1f31c829SZhenyu Wang
f25a49abSColin Xu	mutex_lock(&gvt->lock);
1f31c829SZhenyu Wang	vgpu = __intel_gvt_create_vgpu(gvt, &param);
f25a49abSColin Xu	if (!IS_ERR(vgpu))
1f31c829SZhenyu Wang		/* calculate left instance change for types */
1f31c829SZhenyu Wang		intel_gvt_update_vgpu_types(gvt);
f25a49abSColin Xu	mutex_unlock(&gvt->lock);
1f31c829SZhenyu Wang
1f31c829SZhenyu Wang	return vgpu;
1f31c829SZhenyu Wang}
9ec1e66bSJike Song
9ec1e66bSJike Song/**
cfe65f40SChangbin Du * intel_gvt_reset_vgpu_locked - reset a virtual GPU by DMLR or GT reset
cfe65f40SChangbin Du * @vgpu: virtual GPU
cfe65f40SChangbin Du * @dmlr: vGPU Device Model Level Reset or GT Reset
cfe65f40SChangbin Du * @engine_mask: engines to reset for GT reset
cfe65f40SChangbin Du *
cfe65f40SChangbin Du * This function is called when user wants to reset a virtual GPU through
f25a49abSColin Xu * device model reset or GT reset. The caller should hold the vgpu lock.
cfe65f40SChangbin Du *
cfe65f40SChangbin Du * vGPU Device Model Level Reset (DMLR) simulates the PCI level reset to reset
cfe65f40SChangbin Du * the whole vGPU to default state as when it is created. This vGPU function
cfe65f40SChangbin Du * is required both for functionary and security concerns.The ultimate goal
cfe65f40SChangbin Du * of vGPU FLR is that reuse a vGPU instance by virtual machines. When we
cfe65f40SChangbin Du * assign a vGPU to a virtual machine we must isse such reset first.
cfe65f40SChangbin Du *
cfe65f40SChangbin Du * Full GT Reset and Per-Engine GT Reset are soft reset flow for GPU engines
cfe65f40SChangbin Du * (Render, Blitter, Video, Video Enhancement). It is defined by GPU Spec.
cfe65f40SChangbin Du * Unlike the FLR, GT reset only reset particular resource of a vGPU per
cfe65f40SChangbin Du * the reset request. Guest driver can issue a GT reset by programming the
cfe65f40SChangbin Du * virtual GDRST register to reset specific virtual GPU engine or all
cfe65f40SChangbin Du * engines.
cfe65f40SChangbin Du *
cfe65f40SChangbin Du * The parameter dev_level is to identify if we will do DMLR or GT reset.
cfe65f40SChangbin Du * The parameter engine_mask is to specific the engines that need to be
cfe65f40SChangbin Du * resetted. If value ALL_ENGINES is given for engine_mask, it means
cfe65f40SChangbin Du * the caller requests a full GT reset that we will reset all virtual
cfe65f40SChangbin Du * GPU engines. For FLR, engine_mask is ignored.
cfe65f40SChangbin Du */
cfe65f40SChangbin Duvoid intel_gvt_reset_vgpu_locked(struct intel_vgpu *vgpu, bool dmlr,
cfe65f40SChangbin Du				 unsigned int engine_mask)
cfe65f40SChangbin Du{
cfe65f40SChangbin Du	struct intel_gvt *gvt = vgpu->gvt;
cfe65f40SChangbin Du	struct intel_gvt_workload_scheduler *scheduler = &gvt->scheduler;
6184cc8dSChuanxiao Dong	unsigned int resetting_eng = dmlr ? ALL_ENGINES : engine_mask;
cfe65f40SChangbin Du
cfe65f40SChangbin Du	gvt_dbg_core("------------------------------------------\n");
cfe65f40SChangbin Du	gvt_dbg_core("resseting vgpu%d, dmlr %d, engine_mask %08x\n",
cfe65f40SChangbin Du		     vgpu->id, dmlr, engine_mask);
6184cc8dSChuanxiao Dong
6184cc8dSChuanxiao Dong	vgpu->resetting_eng = resetting_eng;
cfe65f40SChangbin Du
cfe65f40SChangbin Du	intel_vgpu_stop_schedule(vgpu);
cfe65f40SChangbin Du	/*
cfe65f40SChangbin Du	 * The current_vgpu will set to NULL after stopping the
cfe65f40SChangbin Du	 * scheduler when the reset is triggered by current vgpu.
cfe65f40SChangbin Du	 */
cfe65f40SChangbin Du	if (scheduler->current_vgpu == NULL) {
f25a49abSColin Xu		mutex_unlock(&vgpu->vgpu_lock);
cfe65f40SChangbin Du		intel_gvt_wait_vgpu_idle(vgpu);
f25a49abSColin Xu		mutex_lock(&vgpu->vgpu_lock);
cfe65f40SChangbin Du	}
cfe65f40SChangbin Du
06bb372fSZhi Wang	intel_vgpu_reset_submission(vgpu, resetting_eng);
cfe65f40SChangbin Du	/* full GPU reset or device model level reset */
cfe65f40SChangbin Du	if (engine_mask == ALL_ENGINES || dmlr) {
7569a06dSWeinan Li		intel_vgpu_select_submission_ops(vgpu, ALL_ENGINES, 0);
730c8eadSZhi Wang		intel_vgpu_invalidate_ppgtt(vgpu);
615c16a9Sfred gao		/*fence will not be reset during virtual reset */
4d3e67bbSChuanxiao Dong		if (dmlr) {
4d3e67bbSChuanxiao Dong			intel_vgpu_reset_gtt(vgpu);
cfe65f40SChangbin Du			intel_vgpu_reset_resource(vgpu);
4d3e67bbSChuanxiao Dong		}
615c16a9Sfred gao
615c16a9Sfred gao		intel_vgpu_reset_mmio(vgpu, dmlr);
cfe65f40SChangbin Du		populate_pvinfo_page(vgpu);
6294b61bSChangbin Du		intel_vgpu_reset_display(vgpu);
cfe65f40SChangbin Du
fd64be63SMin He		if (dmlr) {
cfe65f40SChangbin Du			intel_vgpu_reset_cfg_space(vgpu);
fd64be63SMin He			/* only reset the failsafe mode when dmlr reset */
fd64be63SMin He			vgpu->failsafe = false;
fd64be63SMin He			vgpu->pv_notified = false;
fd64be63SMin He		}
cfe65f40SChangbin Du	}
cfe65f40SChangbin Du
6184cc8dSChuanxiao Dong	vgpu->resetting_eng = 0;
cfe65f40SChangbin Du	gvt_dbg_core("reset vgpu%d done\n", vgpu->id);
cfe65f40SChangbin Du	gvt_dbg_core("------------------------------------------\n");
cfe65f40SChangbin Du}
cfe65f40SChangbin Du
cfe65f40SChangbin Du/**
cfe65f40SChangbin Du * intel_gvt_reset_vgpu - reset a virtual GPU (Function Level)
9ec1e66bSJike Song * @vgpu: virtual GPU
9ec1e66bSJike Song *
9ec1e66bSJike Song * This function is called when user wants to reset a virtual GPU.
9ec1e66bSJike Song *
9ec1e66bSJike Song */
9ec1e66bSJike Songvoid intel_gvt_reset_vgpu(struct intel_vgpu *vgpu)
9ec1e66bSJike Song{
f25a49abSColin Xu	mutex_lock(&vgpu->vgpu_lock);
cfe65f40SChangbin Du	intel_gvt_reset_vgpu_locked(vgpu, true, 0);
f25a49abSColin Xu	mutex_unlock(&vgpu->vgpu_lock);
9ec1e66bSJike Song}