drm/msm/msm_ringbuffer.h

caab277bSThomas Gleixner/* SPDX-License-Identifier: GPL-2.0-only */
7198e6b0SRob Clark/*
7198e6b0SRob Clark * Copyright (C) 2013 Red Hat
7198e6b0SRob Clark * Author: Rob Clark <robdclark@gmail.com>
7198e6b0SRob Clark */
7198e6b0SRob Clark
7198e6b0SRob Clark#ifndef __MSM_RINGBUFFER_H__
7198e6b0SRob Clark#define __MSM_RINGBUFFER_H__
7198e6b0SRob Clark
1d8a5ca4SRob Clark#include "drm/gpu_scheduler.h"
7198e6b0SRob Clark#include "msm_drv.h"
7198e6b0SRob Clark
f97decacSJordan Crouse#define rbmemptr(ring, member)  \
f97decacSJordan Crouse	((ring)->memptrs_iova + offsetof(struct msm_rbmemptrs, member))
f97decacSJordan Crouse
56869210SJordan Crouse#define rbmemptr_stats(ring, index, member) \
56869210SJordan Crouse	(rbmemptr((ring), stats) + \
56869210SJordan Crouse	 ((index) * sizeof(struct msm_gpu_submit_stats)) + \
56869210SJordan Crouse	 offsetof(struct msm_gpu_submit_stats, member))
56869210SJordan Crouse
56869210SJordan Crousestruct msm_gpu_submit_stats {
56869210SJordan Crouse	u64 cpcycles_start;
56869210SJordan Crouse	u64 cpcycles_end;
56869210SJordan Crouse	u64 alwayson_start;
56869210SJordan Crouse	u64 alwayson_end;
56869210SJordan Crouse};
56869210SJordan Crouse
56869210SJordan Crouse#define MSM_GPU_SUBMIT_STATS_COUNT 64
56869210SJordan Crouse
f97decacSJordan Crousestruct msm_rbmemptrs {
f97decacSJordan Crouse	volatile uint32_t rptr;
f97decacSJordan Crouse	volatile uint32_t fence;
56869210SJordan Crouse
56869210SJordan Crouse	volatile struct msm_gpu_submit_stats stats[MSM_GPU_SUBMIT_STATS_COUNT];
84c31ee1SJordan Crouse	volatile u64 ttbr0;
7198e6b0SRob Clark};
7198e6b0SRob Clark
*d73b1d02SRob Clarkstruct msm_cp_state {
*d73b1d02SRob Clark	uint64_t ib1_base, ib2_base;
*d73b1d02SRob Clark	uint32_t ib1_rem, ib2_rem;
*d73b1d02SRob Clark};
*d73b1d02SRob Clark
f97decacSJordan Crousestruct msm_ringbuffer {
f97decacSJordan Crouse	struct msm_gpu *gpu;
f97decacSJordan Crouse	int id;
f97decacSJordan Crouse	struct drm_gem_object *bo;
4c7085a5SJordan Crouse	uint32_t *start, *end, *cur, *next;
77d20529SRob Clark
77d20529SRob Clark	/*
1d8a5ca4SRob Clark	 * The job scheduler for this ring.
1d8a5ca4SRob Clark	 */
1d8a5ca4SRob Clark	struct drm_gpu_scheduler sched;
1d8a5ca4SRob Clark
1d8a5ca4SRob Clark	/*
77d20529SRob Clark	 * List of in-flight submits on this ring.  Protected by submit_lock.
1d8a5ca4SRob Clark	 *
1d8a5ca4SRob Clark	 * Currently just submits that are already written into the ring, not
1d8a5ca4SRob Clark	 * submits that are still in drm_gpu_scheduler's queues.  At a later
1d8a5ca4SRob Clark	 * step we could probably move to letting drm_gpu_scheduler manage
1d8a5ca4SRob Clark	 * hangcheck detection and keep track of submit jobs that are in-
1d8a5ca4SRob Clark	 * flight.
77d20529SRob Clark	 */
f97decacSJordan Crouse	struct list_head submits;
77d20529SRob Clark	spinlock_t submit_lock;
77d20529SRob Clark
f97decacSJordan Crouse	uint64_t iova;
f97decacSJordan Crouse	uint32_t hangcheck_fence;
f97decacSJordan Crouse	struct msm_rbmemptrs *memptrs;
f97decacSJordan Crouse	uint64_t memptrs_iova;
f97decacSJordan Crouse	struct msm_fence_context *fctx;
77c40603SRob Clark
*d73b1d02SRob Clark	/**
*d73b1d02SRob Clark	 * hangcheck_progress_retries:
*d73b1d02SRob Clark	 *
*d73b1d02SRob Clark	 * The number of extra hangcheck duration cycles that we have given
*d73b1d02SRob Clark	 * due to it appearing that the GPU is making forward progress.
*d73b1d02SRob Clark	 *
*d73b1d02SRob Clark	 * For GPU generations which support progress detection (see.
*d73b1d02SRob Clark	 * msm_gpu_funcs::progress()), if the GPU appears to be making progress
*d73b1d02SRob Clark	 * (ie. the CP has advanced in the command stream, we'll allow up to
*d73b1d02SRob Clark	 * DRM_MSM_HANGCHECK_PROGRESS_RETRIES expirations of the hangcheck timer
*d73b1d02SRob Clark	 * before killing the job.  But to detect progress we need two sample
*d73b1d02SRob Clark	 * points, so the duration of the hangcheck timer is halved.  In other
*d73b1d02SRob Clark	 * words we'll let the submit run for up to:
*d73b1d02SRob Clark	 *
*d73b1d02SRob Clark	 * (DRM_MSM_HANGCHECK_DEFAULT_PERIOD / 2) * (DRM_MSM_HANGCHECK_PROGRESS_RETRIES + 1)
*d73b1d02SRob Clark	 */
*d73b1d02SRob Clark	int hangcheck_progress_retries;
*d73b1d02SRob Clark
*d73b1d02SRob Clark	/**
*d73b1d02SRob Clark	 * last_cp_state: The state of the CP at the last call to gpu->progress()
*d73b1d02SRob Clark	 */
*d73b1d02SRob Clark	struct msm_cp_state last_cp_state;
*d73b1d02SRob Clark
77c40603SRob Clark	/*
77c40603SRob Clark	 * preempt_lock protects preemption and serializes wptr updates against
77c40603SRob Clark	 * preemption.  Can be aquired from irq context.
77c40603SRob Clark	 */
77c40603SRob Clark	spinlock_t preempt_lock;
f97decacSJordan Crouse};
f97decacSJordan Crouse
f97decacSJordan Crousestruct msm_ringbuffer *msm_ringbuffer_new(struct msm_gpu *gpu, int id,
f97decacSJordan Crouse		void *memptrs, uint64_t memptrs_iova);
7198e6b0SRob Clarkvoid msm_ringbuffer_destroy(struct msm_ringbuffer *ring);
7198e6b0SRob Clark
7198e6b0SRob Clark/* ringbuffer helpers (the parts that are same for a3xx/a2xx/z180..) */
7198e6b0SRob Clark
7198e6b0SRob Clarkstatic inline void
7198e6b0SRob ClarkOUT_RING(struct msm_ringbuffer *ring, uint32_t data)
7198e6b0SRob Clark{
4c7085a5SJordan Crouse	/*
4c7085a5SJordan Crouse	 * ring->next points to the current command being written - it won't be
4c7085a5SJordan Crouse	 * committed as ring->cur until the flush
4c7085a5SJordan Crouse	 */
4c7085a5SJordan Crouse	if (ring->next == ring->end)
4c7085a5SJordan Crouse		ring->next = ring->start;
4c7085a5SJordan Crouse	*(ring->next++) = data;
7198e6b0SRob Clark}
7198e6b0SRob Clark
7198e6b0SRob Clark#endif /* __MSM_RINGBUFFER_H__ */