xref: /openbmc/linux/drivers/infiniband/core/rw.c (revision 6cb2d5b1)
1a060b562SChristoph Hellwig /*
2a060b562SChristoph Hellwig  * Copyright (c) 2016 HGST, a Western Digital Company.
3a060b562SChristoph Hellwig  *
4a060b562SChristoph Hellwig  * This program is free software; you can redistribute it and/or modify it
5a060b562SChristoph Hellwig  * under the terms and conditions of the GNU General Public License,
6a060b562SChristoph Hellwig  * version 2, as published by the Free Software Foundation.
7a060b562SChristoph Hellwig  *
8a060b562SChristoph Hellwig  * This program is distributed in the hope it will be useful, but WITHOUT
9a060b562SChristoph Hellwig  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
10a060b562SChristoph Hellwig  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
11a060b562SChristoph Hellwig  * more details.
12a060b562SChristoph Hellwig  */
13a060b562SChristoph Hellwig #include <linux/moduleparam.h>
14a060b562SChristoph Hellwig #include <linux/slab.h>
1550b7d220SLogan Gunthorpe #include <linux/pci-p2pdma.h>
16a060b562SChristoph Hellwig #include <rdma/mr_pool.h>
17a060b562SChristoph Hellwig #include <rdma/rw.h>
18a060b562SChristoph Hellwig 
19a060b562SChristoph Hellwig enum {
20a060b562SChristoph Hellwig 	RDMA_RW_SINGLE_WR,
21a060b562SChristoph Hellwig 	RDMA_RW_MULTI_WR,
22a060b562SChristoph Hellwig 	RDMA_RW_MR,
230e353e34SChristoph Hellwig 	RDMA_RW_SIG_MR,
24a060b562SChristoph Hellwig };
25a060b562SChristoph Hellwig 
26a060b562SChristoph Hellwig static bool rdma_rw_force_mr;
27a060b562SChristoph Hellwig module_param_named(force_mr, rdma_rw_force_mr, bool, 0);
28a060b562SChristoph Hellwig MODULE_PARM_DESC(force_mr, "Force usage of MRs for RDMA READ/WRITE operations");
29a060b562SChristoph Hellwig 
30a060b562SChristoph Hellwig /*
31a060b562SChristoph Hellwig  * Check if the device might use memory registration.  This is currently only
32a060b562SChristoph Hellwig  * true for iWarp devices. In the future we can hopefully fine tune this based
33a060b562SChristoph Hellwig  * on HCA driver input.
34a060b562SChristoph Hellwig  */
35a060b562SChristoph Hellwig static inline bool rdma_rw_can_use_mr(struct ib_device *dev, u8 port_num)
36a060b562SChristoph Hellwig {
37a060b562SChristoph Hellwig 	if (rdma_protocol_iwarp(dev, port_num))
38a060b562SChristoph Hellwig 		return true;
39a060b562SChristoph Hellwig 	if (unlikely(rdma_rw_force_mr))
40a060b562SChristoph Hellwig 		return true;
41a060b562SChristoph Hellwig 	return false;
42a060b562SChristoph Hellwig }
43a060b562SChristoph Hellwig 
44a060b562SChristoph Hellwig /*
45a060b562SChristoph Hellwig  * Check if the device will use memory registration for this RW operation.
46a060b562SChristoph Hellwig  * We currently always use memory registrations for iWarp RDMA READs, and
47a060b562SChristoph Hellwig  * have a debug option to force usage of MRs.
48a060b562SChristoph Hellwig  *
49a060b562SChristoph Hellwig  * XXX: In the future we can hopefully fine tune this based on HCA driver
50a060b562SChristoph Hellwig  * input.
51a060b562SChristoph Hellwig  */
52a060b562SChristoph Hellwig static inline bool rdma_rw_io_needs_mr(struct ib_device *dev, u8 port_num,
53a060b562SChristoph Hellwig 		enum dma_data_direction dir, int dma_nents)
54a060b562SChristoph Hellwig {
55a060b562SChristoph Hellwig 	if (rdma_protocol_iwarp(dev, port_num) && dir == DMA_FROM_DEVICE)
56a060b562SChristoph Hellwig 		return true;
57a060b562SChristoph Hellwig 	if (unlikely(rdma_rw_force_mr))
58a060b562SChristoph Hellwig 		return true;
59a060b562SChristoph Hellwig 	return false;
60a060b562SChristoph Hellwig }
61a060b562SChristoph Hellwig 
62a060b562SChristoph Hellwig static inline u32 rdma_rw_fr_page_list_len(struct ib_device *dev)
63a060b562SChristoph Hellwig {
64a060b562SChristoph Hellwig 	/* arbitrary limit to avoid allocating gigantic resources */
65a060b562SChristoph Hellwig 	return min_t(u32, dev->attrs.max_fast_reg_page_list_len, 256);
66a060b562SChristoph Hellwig }
67a060b562SChristoph Hellwig 
686cb2d5b1SIsrael Rukshin static inline int rdma_rw_inv_key(struct rdma_rw_reg_ctx *reg)
696cb2d5b1SIsrael Rukshin {
706cb2d5b1SIsrael Rukshin 	int count = 0;
716cb2d5b1SIsrael Rukshin 
726cb2d5b1SIsrael Rukshin 	if (reg->mr->need_inval) {
736cb2d5b1SIsrael Rukshin 		reg->inv_wr.opcode = IB_WR_LOCAL_INV;
746cb2d5b1SIsrael Rukshin 		reg->inv_wr.ex.invalidate_rkey = reg->mr->lkey;
756cb2d5b1SIsrael Rukshin 		reg->inv_wr.next = &reg->reg_wr.wr;
766cb2d5b1SIsrael Rukshin 		count++;
776cb2d5b1SIsrael Rukshin 	} else {
786cb2d5b1SIsrael Rukshin 		reg->inv_wr.next = NULL;
796cb2d5b1SIsrael Rukshin 	}
806cb2d5b1SIsrael Rukshin 
816cb2d5b1SIsrael Rukshin 	return count;
826cb2d5b1SIsrael Rukshin }
836cb2d5b1SIsrael Rukshin 
84eaa74ec7SBart Van Assche /* Caller must have zero-initialized *reg. */
85a060b562SChristoph Hellwig static int rdma_rw_init_one_mr(struct ib_qp *qp, u8 port_num,
86a060b562SChristoph Hellwig 		struct rdma_rw_reg_ctx *reg, struct scatterlist *sg,
87a060b562SChristoph Hellwig 		u32 sg_cnt, u32 offset)
88a060b562SChristoph Hellwig {
89a060b562SChristoph Hellwig 	u32 pages_per_mr = rdma_rw_fr_page_list_len(qp->pd->device);
90a060b562SChristoph Hellwig 	u32 nents = min(sg_cnt, pages_per_mr);
91a060b562SChristoph Hellwig 	int count = 0, ret;
92a060b562SChristoph Hellwig 
93a060b562SChristoph Hellwig 	reg->mr = ib_mr_pool_get(qp, &qp->rdma_mrs);
94a060b562SChristoph Hellwig 	if (!reg->mr)
95a060b562SChristoph Hellwig 		return -EAGAIN;
96a060b562SChristoph Hellwig 
976cb2d5b1SIsrael Rukshin 	count += rdma_rw_inv_key(reg);
98a060b562SChristoph Hellwig 
999aa8b321SBart Van Assche 	ret = ib_map_mr_sg(reg->mr, sg, nents, &offset, PAGE_SIZE);
100c2d7c8ffSDan Carpenter 	if (ret < 0 || ret < nents) {
101a060b562SChristoph Hellwig 		ib_mr_pool_put(qp, &qp->rdma_mrs, reg->mr);
102a060b562SChristoph Hellwig 		return -EINVAL;
103a060b562SChristoph Hellwig 	}
104a060b562SChristoph Hellwig 
105a060b562SChristoph Hellwig 	reg->reg_wr.wr.opcode = IB_WR_REG_MR;
106a060b562SChristoph Hellwig 	reg->reg_wr.mr = reg->mr;
107a060b562SChristoph Hellwig 	reg->reg_wr.access = IB_ACCESS_LOCAL_WRITE;
108a060b562SChristoph Hellwig 	if (rdma_protocol_iwarp(qp->device, port_num))
109a060b562SChristoph Hellwig 		reg->reg_wr.access |= IB_ACCESS_REMOTE_WRITE;
110a060b562SChristoph Hellwig 	count++;
111a060b562SChristoph Hellwig 
112a060b562SChristoph Hellwig 	reg->sge.addr = reg->mr->iova;
113a060b562SChristoph Hellwig 	reg->sge.length = reg->mr->length;
114a060b562SChristoph Hellwig 	return count;
115a060b562SChristoph Hellwig }
116a060b562SChristoph Hellwig 
117a060b562SChristoph Hellwig static int rdma_rw_init_mr_wrs(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
118a060b562SChristoph Hellwig 		u8 port_num, struct scatterlist *sg, u32 sg_cnt, u32 offset,
119a060b562SChristoph Hellwig 		u64 remote_addr, u32 rkey, enum dma_data_direction dir)
120a060b562SChristoph Hellwig {
121eaa74ec7SBart Van Assche 	struct rdma_rw_reg_ctx *prev = NULL;
122a060b562SChristoph Hellwig 	u32 pages_per_mr = rdma_rw_fr_page_list_len(qp->pd->device);
123a060b562SChristoph Hellwig 	int i, j, ret = 0, count = 0;
124a060b562SChristoph Hellwig 
125a060b562SChristoph Hellwig 	ctx->nr_ops = (sg_cnt + pages_per_mr - 1) / pages_per_mr;
126a060b562SChristoph Hellwig 	ctx->reg = kcalloc(ctx->nr_ops, sizeof(*ctx->reg), GFP_KERNEL);
127a060b562SChristoph Hellwig 	if (!ctx->reg) {
128a060b562SChristoph Hellwig 		ret = -ENOMEM;
129a060b562SChristoph Hellwig 		goto out;
130a060b562SChristoph Hellwig 	}
131a060b562SChristoph Hellwig 
132a060b562SChristoph Hellwig 	for (i = 0; i < ctx->nr_ops; i++) {
133a060b562SChristoph Hellwig 		struct rdma_rw_reg_ctx *reg = &ctx->reg[i];
134a060b562SChristoph Hellwig 		u32 nents = min(sg_cnt, pages_per_mr);
135a060b562SChristoph Hellwig 
136a060b562SChristoph Hellwig 		ret = rdma_rw_init_one_mr(qp, port_num, reg, sg, sg_cnt,
137a060b562SChristoph Hellwig 				offset);
138a060b562SChristoph Hellwig 		if (ret < 0)
139a060b562SChristoph Hellwig 			goto out_free;
140a060b562SChristoph Hellwig 		count += ret;
141a060b562SChristoph Hellwig 
142a060b562SChristoph Hellwig 		if (prev) {
143a060b562SChristoph Hellwig 			if (reg->mr->need_inval)
144a060b562SChristoph Hellwig 				prev->wr.wr.next = &reg->inv_wr;
145a060b562SChristoph Hellwig 			else
146a060b562SChristoph Hellwig 				prev->wr.wr.next = &reg->reg_wr.wr;
147a060b562SChristoph Hellwig 		}
148a060b562SChristoph Hellwig 
149a060b562SChristoph Hellwig 		reg->reg_wr.wr.next = &reg->wr.wr;
150a060b562SChristoph Hellwig 
151a060b562SChristoph Hellwig 		reg->wr.wr.sg_list = &reg->sge;
152a060b562SChristoph Hellwig 		reg->wr.wr.num_sge = 1;
153a060b562SChristoph Hellwig 		reg->wr.remote_addr = remote_addr;
154a060b562SChristoph Hellwig 		reg->wr.rkey = rkey;
155a060b562SChristoph Hellwig 		if (dir == DMA_TO_DEVICE) {
156a060b562SChristoph Hellwig 			reg->wr.wr.opcode = IB_WR_RDMA_WRITE;
157a060b562SChristoph Hellwig 		} else if (!rdma_cap_read_inv(qp->device, port_num)) {
158a060b562SChristoph Hellwig 			reg->wr.wr.opcode = IB_WR_RDMA_READ;
159a060b562SChristoph Hellwig 		} else {
160a060b562SChristoph Hellwig 			reg->wr.wr.opcode = IB_WR_RDMA_READ_WITH_INV;
161a060b562SChristoph Hellwig 			reg->wr.wr.ex.invalidate_rkey = reg->mr->lkey;
162a060b562SChristoph Hellwig 		}
163a060b562SChristoph Hellwig 		count++;
164a060b562SChristoph Hellwig 
165a060b562SChristoph Hellwig 		remote_addr += reg->sge.length;
166a060b562SChristoph Hellwig 		sg_cnt -= nents;
167a060b562SChristoph Hellwig 		for (j = 0; j < nents; j++)
168a060b562SChristoph Hellwig 			sg = sg_next(sg);
169eaa74ec7SBart Van Assche 		prev = reg;
170a060b562SChristoph Hellwig 		offset = 0;
171a060b562SChristoph Hellwig 	}
172a060b562SChristoph Hellwig 
173eaa74ec7SBart Van Assche 	if (prev)
174eaa74ec7SBart Van Assche 		prev->wr.wr.next = NULL;
175eaa74ec7SBart Van Assche 
176a060b562SChristoph Hellwig 	ctx->type = RDMA_RW_MR;
177a060b562SChristoph Hellwig 	return count;
178a060b562SChristoph Hellwig 
179a060b562SChristoph Hellwig out_free:
180a060b562SChristoph Hellwig 	while (--i >= 0)
181a060b562SChristoph Hellwig 		ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->reg[i].mr);
182a060b562SChristoph Hellwig 	kfree(ctx->reg);
183a060b562SChristoph Hellwig out:
184a060b562SChristoph Hellwig 	return ret;
185a060b562SChristoph Hellwig }
186a060b562SChristoph Hellwig 
187a060b562SChristoph Hellwig static int rdma_rw_init_map_wrs(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
188a060b562SChristoph Hellwig 		struct scatterlist *sg, u32 sg_cnt, u32 offset,
189a060b562SChristoph Hellwig 		u64 remote_addr, u32 rkey, enum dma_data_direction dir)
190a060b562SChristoph Hellwig {
191632bc3f6SBart Van Assche 	u32 max_sge = dir == DMA_TO_DEVICE ? qp->max_write_sge :
192632bc3f6SBart Van Assche 		      qp->max_read_sge;
193a060b562SChristoph Hellwig 	struct ib_sge *sge;
194a060b562SChristoph Hellwig 	u32 total_len = 0, i, j;
195a060b562SChristoph Hellwig 
196a060b562SChristoph Hellwig 	ctx->nr_ops = DIV_ROUND_UP(sg_cnt, max_sge);
197a060b562SChristoph Hellwig 
198a060b562SChristoph Hellwig 	ctx->map.sges = sge = kcalloc(sg_cnt, sizeof(*sge), GFP_KERNEL);
199a060b562SChristoph Hellwig 	if (!ctx->map.sges)
200a060b562SChristoph Hellwig 		goto out;
201a060b562SChristoph Hellwig 
202a060b562SChristoph Hellwig 	ctx->map.wrs = kcalloc(ctx->nr_ops, sizeof(*ctx->map.wrs), GFP_KERNEL);
203a060b562SChristoph Hellwig 	if (!ctx->map.wrs)
204a060b562SChristoph Hellwig 		goto out_free_sges;
205a060b562SChristoph Hellwig 
206a060b562SChristoph Hellwig 	for (i = 0; i < ctx->nr_ops; i++) {
207a060b562SChristoph Hellwig 		struct ib_rdma_wr *rdma_wr = &ctx->map.wrs[i];
208a060b562SChristoph Hellwig 		u32 nr_sge = min(sg_cnt, max_sge);
209a060b562SChristoph Hellwig 
210a060b562SChristoph Hellwig 		if (dir == DMA_TO_DEVICE)
211a060b562SChristoph Hellwig 			rdma_wr->wr.opcode = IB_WR_RDMA_WRITE;
212a060b562SChristoph Hellwig 		else
213a060b562SChristoph Hellwig 			rdma_wr->wr.opcode = IB_WR_RDMA_READ;
214a060b562SChristoph Hellwig 		rdma_wr->remote_addr = remote_addr + total_len;
215a060b562SChristoph Hellwig 		rdma_wr->rkey = rkey;
216eaa74ec7SBart Van Assche 		rdma_wr->wr.num_sge = nr_sge;
217a060b562SChristoph Hellwig 		rdma_wr->wr.sg_list = sge;
218a060b562SChristoph Hellwig 
219a060b562SChristoph Hellwig 		for (j = 0; j < nr_sge; j++, sg = sg_next(sg)) {
220a163afc8SBart Van Assche 			sge->addr = sg_dma_address(sg) + offset;
221a163afc8SBart Van Assche 			sge->length = sg_dma_len(sg) - offset;
222a060b562SChristoph Hellwig 			sge->lkey = qp->pd->local_dma_lkey;
223a060b562SChristoph Hellwig 
224a060b562SChristoph Hellwig 			total_len += sge->length;
225a060b562SChristoph Hellwig 			sge++;
226a060b562SChristoph Hellwig 			sg_cnt--;
227a060b562SChristoph Hellwig 			offset = 0;
228a060b562SChristoph Hellwig 		}
229a060b562SChristoph Hellwig 
230eaa74ec7SBart Van Assche 		rdma_wr->wr.next = i + 1 < ctx->nr_ops ?
231eaa74ec7SBart Van Assche 			&ctx->map.wrs[i + 1].wr : NULL;
232a060b562SChristoph Hellwig 	}
233a060b562SChristoph Hellwig 
234a060b562SChristoph Hellwig 	ctx->type = RDMA_RW_MULTI_WR;
235a060b562SChristoph Hellwig 	return ctx->nr_ops;
236a060b562SChristoph Hellwig 
237a060b562SChristoph Hellwig out_free_sges:
238a060b562SChristoph Hellwig 	kfree(ctx->map.sges);
239a060b562SChristoph Hellwig out:
240a060b562SChristoph Hellwig 	return -ENOMEM;
241a060b562SChristoph Hellwig }
242a060b562SChristoph Hellwig 
243a060b562SChristoph Hellwig static int rdma_rw_init_single_wr(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
244a060b562SChristoph Hellwig 		struct scatterlist *sg, u32 offset, u64 remote_addr, u32 rkey,
245a060b562SChristoph Hellwig 		enum dma_data_direction dir)
246a060b562SChristoph Hellwig {
247a060b562SChristoph Hellwig 	struct ib_rdma_wr *rdma_wr = &ctx->single.wr;
248a060b562SChristoph Hellwig 
249a060b562SChristoph Hellwig 	ctx->nr_ops = 1;
250a060b562SChristoph Hellwig 
251a060b562SChristoph Hellwig 	ctx->single.sge.lkey = qp->pd->local_dma_lkey;
252a163afc8SBart Van Assche 	ctx->single.sge.addr = sg_dma_address(sg) + offset;
253a163afc8SBart Van Assche 	ctx->single.sge.length = sg_dma_len(sg) - offset;
254a060b562SChristoph Hellwig 
255a060b562SChristoph Hellwig 	memset(rdma_wr, 0, sizeof(*rdma_wr));
256a060b562SChristoph Hellwig 	if (dir == DMA_TO_DEVICE)
257a060b562SChristoph Hellwig 		rdma_wr->wr.opcode = IB_WR_RDMA_WRITE;
258a060b562SChristoph Hellwig 	else
259a060b562SChristoph Hellwig 		rdma_wr->wr.opcode = IB_WR_RDMA_READ;
260a060b562SChristoph Hellwig 	rdma_wr->wr.sg_list = &ctx->single.sge;
261a060b562SChristoph Hellwig 	rdma_wr->wr.num_sge = 1;
262a060b562SChristoph Hellwig 	rdma_wr->remote_addr = remote_addr;
263a060b562SChristoph Hellwig 	rdma_wr->rkey = rkey;
264a060b562SChristoph Hellwig 
265a060b562SChristoph Hellwig 	ctx->type = RDMA_RW_SINGLE_WR;
266a060b562SChristoph Hellwig 	return 1;
267a060b562SChristoph Hellwig }
268a060b562SChristoph Hellwig 
269a060b562SChristoph Hellwig /**
270a060b562SChristoph Hellwig  * rdma_rw_ctx_init - initialize a RDMA READ/WRITE context
271a060b562SChristoph Hellwig  * @ctx:	context to initialize
272a060b562SChristoph Hellwig  * @qp:		queue pair to operate on
273a060b562SChristoph Hellwig  * @port_num:	port num to which the connection is bound
274a060b562SChristoph Hellwig  * @sg:		scatterlist to READ/WRITE from/to
275a060b562SChristoph Hellwig  * @sg_cnt:	number of entries in @sg
276a060b562SChristoph Hellwig  * @sg_offset:	current byte offset into @sg
277a060b562SChristoph Hellwig  * @remote_addr:remote address to read/write (relative to @rkey)
278a060b562SChristoph Hellwig  * @rkey:	remote key to operate on
279a060b562SChristoph Hellwig  * @dir:	%DMA_TO_DEVICE for RDMA WRITE, %DMA_FROM_DEVICE for RDMA READ
280a060b562SChristoph Hellwig  *
281a060b562SChristoph Hellwig  * Returns the number of WQEs that will be needed on the workqueue if
282a060b562SChristoph Hellwig  * successful, or a negative error code.
283a060b562SChristoph Hellwig  */
284a060b562SChristoph Hellwig int rdma_rw_ctx_init(struct rdma_rw_ctx *ctx, struct ib_qp *qp, u8 port_num,
285a060b562SChristoph Hellwig 		struct scatterlist *sg, u32 sg_cnt, u32 sg_offset,
286a060b562SChristoph Hellwig 		u64 remote_addr, u32 rkey, enum dma_data_direction dir)
287a060b562SChristoph Hellwig {
288a060b562SChristoph Hellwig 	struct ib_device *dev = qp->pd->device;
289a060b562SChristoph Hellwig 	int ret;
290a060b562SChristoph Hellwig 
29150b7d220SLogan Gunthorpe 	if (is_pci_p2pdma_page(sg_page(sg)))
29250b7d220SLogan Gunthorpe 		ret = pci_p2pdma_map_sg(dev->dma_device, sg, sg_cnt, dir);
29350b7d220SLogan Gunthorpe 	else
294a060b562SChristoph Hellwig 		ret = ib_dma_map_sg(dev, sg, sg_cnt, dir);
29550b7d220SLogan Gunthorpe 
296a060b562SChristoph Hellwig 	if (!ret)
297a060b562SChristoph Hellwig 		return -ENOMEM;
298a060b562SChristoph Hellwig 	sg_cnt = ret;
299a060b562SChristoph Hellwig 
300a060b562SChristoph Hellwig 	/*
301a060b562SChristoph Hellwig 	 * Skip to the S/G entry that sg_offset falls into:
302a060b562SChristoph Hellwig 	 */
303a060b562SChristoph Hellwig 	for (;;) {
304a163afc8SBart Van Assche 		u32 len = sg_dma_len(sg);
305a060b562SChristoph Hellwig 
306a060b562SChristoph Hellwig 		if (sg_offset < len)
307a060b562SChristoph Hellwig 			break;
308a060b562SChristoph Hellwig 
309a060b562SChristoph Hellwig 		sg = sg_next(sg);
310a060b562SChristoph Hellwig 		sg_offset -= len;
311a060b562SChristoph Hellwig 		sg_cnt--;
312a060b562SChristoph Hellwig 	}
313a060b562SChristoph Hellwig 
314a060b562SChristoph Hellwig 	ret = -EIO;
315a060b562SChristoph Hellwig 	if (WARN_ON_ONCE(sg_cnt == 0))
316a060b562SChristoph Hellwig 		goto out_unmap_sg;
317a060b562SChristoph Hellwig 
318a060b562SChristoph Hellwig 	if (rdma_rw_io_needs_mr(qp->device, port_num, dir, sg_cnt)) {
319a060b562SChristoph Hellwig 		ret = rdma_rw_init_mr_wrs(ctx, qp, port_num, sg, sg_cnt,
320a060b562SChristoph Hellwig 				sg_offset, remote_addr, rkey, dir);
321a060b562SChristoph Hellwig 	} else if (sg_cnt > 1) {
322a060b562SChristoph Hellwig 		ret = rdma_rw_init_map_wrs(ctx, qp, sg, sg_cnt, sg_offset,
323a060b562SChristoph Hellwig 				remote_addr, rkey, dir);
324a060b562SChristoph Hellwig 	} else {
325a060b562SChristoph Hellwig 		ret = rdma_rw_init_single_wr(ctx, qp, sg, sg_offset,
326a060b562SChristoph Hellwig 				remote_addr, rkey, dir);
327a060b562SChristoph Hellwig 	}
328a060b562SChristoph Hellwig 
329a060b562SChristoph Hellwig 	if (ret < 0)
330a060b562SChristoph Hellwig 		goto out_unmap_sg;
331a060b562SChristoph Hellwig 	return ret;
332a060b562SChristoph Hellwig 
333a060b562SChristoph Hellwig out_unmap_sg:
334a060b562SChristoph Hellwig 	ib_dma_unmap_sg(dev, sg, sg_cnt, dir);
335a060b562SChristoph Hellwig 	return ret;
336a060b562SChristoph Hellwig }
337a060b562SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_init);
338a060b562SChristoph Hellwig 
3390e353e34SChristoph Hellwig /**
340222c7b1fSBart Van Assche  * rdma_rw_ctx_signature_init - initialize a RW context with signature offload
3410e353e34SChristoph Hellwig  * @ctx:	context to initialize
3420e353e34SChristoph Hellwig  * @qp:		queue pair to operate on
3430e353e34SChristoph Hellwig  * @port_num:	port num to which the connection is bound
3440e353e34SChristoph Hellwig  * @sg:		scatterlist to READ/WRITE from/to
3450e353e34SChristoph Hellwig  * @sg_cnt:	number of entries in @sg
3460e353e34SChristoph Hellwig  * @prot_sg:	scatterlist to READ/WRITE protection information from/to
3470e353e34SChristoph Hellwig  * @prot_sg_cnt: number of entries in @prot_sg
3480e353e34SChristoph Hellwig  * @sig_attrs:	signature offloading algorithms
3490e353e34SChristoph Hellwig  * @remote_addr:remote address to read/write (relative to @rkey)
3500e353e34SChristoph Hellwig  * @rkey:	remote key to operate on
3510e353e34SChristoph Hellwig  * @dir:	%DMA_TO_DEVICE for RDMA WRITE, %DMA_FROM_DEVICE for RDMA READ
3520e353e34SChristoph Hellwig  *
3530e353e34SChristoph Hellwig  * Returns the number of WQEs that will be needed on the workqueue if
3540e353e34SChristoph Hellwig  * successful, or a negative error code.
3550e353e34SChristoph Hellwig  */
3560e353e34SChristoph Hellwig int rdma_rw_ctx_signature_init(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
3570e353e34SChristoph Hellwig 		u8 port_num, struct scatterlist *sg, u32 sg_cnt,
3580e353e34SChristoph Hellwig 		struct scatterlist *prot_sg, u32 prot_sg_cnt,
3590e353e34SChristoph Hellwig 		struct ib_sig_attrs *sig_attrs,
3600e353e34SChristoph Hellwig 		u64 remote_addr, u32 rkey, enum dma_data_direction dir)
3610e353e34SChristoph Hellwig {
3620e353e34SChristoph Hellwig 	struct ib_device *dev = qp->pd->device;
3630e353e34SChristoph Hellwig 	u32 pages_per_mr = rdma_rw_fr_page_list_len(qp->pd->device);
3640e353e34SChristoph Hellwig 	struct ib_rdma_wr *rdma_wr;
3650e353e34SChristoph Hellwig 	struct ib_send_wr *prev_wr = NULL;
3660e353e34SChristoph Hellwig 	int count = 0, ret;
3670e353e34SChristoph Hellwig 
3680e353e34SChristoph Hellwig 	if (sg_cnt > pages_per_mr || prot_sg_cnt > pages_per_mr) {
36953bfbf9bSMax Gurtovoy 		pr_err("SG count too large: sg_cnt=%d, prot_sg_cnt=%d, pages_per_mr=%d\n",
37053bfbf9bSMax Gurtovoy 		       sg_cnt, prot_sg_cnt, pages_per_mr);
3710e353e34SChristoph Hellwig 		return -EINVAL;
3720e353e34SChristoph Hellwig 	}
3730e353e34SChristoph Hellwig 
3740e353e34SChristoph Hellwig 	ret = ib_dma_map_sg(dev, sg, sg_cnt, dir);
3750e353e34SChristoph Hellwig 	if (!ret)
3760e353e34SChristoph Hellwig 		return -ENOMEM;
3770e353e34SChristoph Hellwig 	sg_cnt = ret;
3780e353e34SChristoph Hellwig 
3790e353e34SChristoph Hellwig 	ret = ib_dma_map_sg(dev, prot_sg, prot_sg_cnt, dir);
3800e353e34SChristoph Hellwig 	if (!ret) {
3810e353e34SChristoph Hellwig 		ret = -ENOMEM;
3820e353e34SChristoph Hellwig 		goto out_unmap_sg;
3830e353e34SChristoph Hellwig 	}
3840e353e34SChristoph Hellwig 	prot_sg_cnt = ret;
3850e353e34SChristoph Hellwig 
3860e353e34SChristoph Hellwig 	ctx->type = RDMA_RW_SIG_MR;
3870e353e34SChristoph Hellwig 	ctx->nr_ops = 1;
3880e353e34SChristoph Hellwig 	ctx->sig = kcalloc(1, sizeof(*ctx->sig), GFP_KERNEL);
3890e353e34SChristoph Hellwig 	if (!ctx->sig) {
3900e353e34SChristoph Hellwig 		ret = -ENOMEM;
3910e353e34SChristoph Hellwig 		goto out_unmap_prot_sg;
3920e353e34SChristoph Hellwig 	}
3930e353e34SChristoph Hellwig 
3940e353e34SChristoph Hellwig 	ret = rdma_rw_init_one_mr(qp, port_num, &ctx->sig->data, sg, sg_cnt, 0);
3950e353e34SChristoph Hellwig 	if (ret < 0)
3960e353e34SChristoph Hellwig 		goto out_free_ctx;
3970e353e34SChristoph Hellwig 	count += ret;
3980e353e34SChristoph Hellwig 	prev_wr = &ctx->sig->data.reg_wr.wr;
3990e353e34SChristoph Hellwig 
4000e353e34SChristoph Hellwig 	ret = rdma_rw_init_one_mr(qp, port_num, &ctx->sig->prot,
4010e353e34SChristoph Hellwig 				  prot_sg, prot_sg_cnt, 0);
4020e353e34SChristoph Hellwig 	if (ret < 0)
4030e353e34SChristoph Hellwig 		goto out_destroy_data_mr;
4040e353e34SChristoph Hellwig 	count += ret;
4050e353e34SChristoph Hellwig 
4060e353e34SChristoph Hellwig 	if (ctx->sig->prot.inv_wr.next)
4070e353e34SChristoph Hellwig 		prev_wr->next = &ctx->sig->prot.inv_wr;
4080e353e34SChristoph Hellwig 	else
4090e353e34SChristoph Hellwig 		prev_wr->next = &ctx->sig->prot.reg_wr.wr;
4100e353e34SChristoph Hellwig 	prev_wr = &ctx->sig->prot.reg_wr.wr;
4110e353e34SChristoph Hellwig 
4120e353e34SChristoph Hellwig 	ctx->sig->sig_mr = ib_mr_pool_get(qp, &qp->sig_mrs);
4130e353e34SChristoph Hellwig 	if (!ctx->sig->sig_mr) {
4140e353e34SChristoph Hellwig 		ret = -EAGAIN;
4150e353e34SChristoph Hellwig 		goto out_destroy_prot_mr;
4160e353e34SChristoph Hellwig 	}
4170e353e34SChristoph Hellwig 
4180e353e34SChristoph Hellwig 	if (ctx->sig->sig_mr->need_inval) {
4190e353e34SChristoph Hellwig 		memset(&ctx->sig->sig_inv_wr, 0, sizeof(ctx->sig->sig_inv_wr));
4200e353e34SChristoph Hellwig 
4210e353e34SChristoph Hellwig 		ctx->sig->sig_inv_wr.opcode = IB_WR_LOCAL_INV;
4220e353e34SChristoph Hellwig 		ctx->sig->sig_inv_wr.ex.invalidate_rkey = ctx->sig->sig_mr->rkey;
4230e353e34SChristoph Hellwig 
4240e353e34SChristoph Hellwig 		prev_wr->next = &ctx->sig->sig_inv_wr;
4250e353e34SChristoph Hellwig 		prev_wr = &ctx->sig->sig_inv_wr;
4260e353e34SChristoph Hellwig 	}
4270e353e34SChristoph Hellwig 
4280e353e34SChristoph Hellwig 	ctx->sig->sig_wr.wr.opcode = IB_WR_REG_SIG_MR;
4290e353e34SChristoph Hellwig 	ctx->sig->sig_wr.wr.wr_cqe = NULL;
4300e353e34SChristoph Hellwig 	ctx->sig->sig_wr.wr.sg_list = &ctx->sig->data.sge;
4310e353e34SChristoph Hellwig 	ctx->sig->sig_wr.wr.num_sge = 1;
4320e353e34SChristoph Hellwig 	ctx->sig->sig_wr.access_flags = IB_ACCESS_LOCAL_WRITE;
4330e353e34SChristoph Hellwig 	ctx->sig->sig_wr.sig_attrs = sig_attrs;
4340e353e34SChristoph Hellwig 	ctx->sig->sig_wr.sig_mr = ctx->sig->sig_mr;
4350e353e34SChristoph Hellwig 	if (prot_sg_cnt)
4360e353e34SChristoph Hellwig 		ctx->sig->sig_wr.prot = &ctx->sig->prot.sge;
4370e353e34SChristoph Hellwig 	prev_wr->next = &ctx->sig->sig_wr.wr;
4380e353e34SChristoph Hellwig 	prev_wr = &ctx->sig->sig_wr.wr;
4390e353e34SChristoph Hellwig 	count++;
4400e353e34SChristoph Hellwig 
4410e353e34SChristoph Hellwig 	ctx->sig->sig_sge.addr = 0;
4420e353e34SChristoph Hellwig 	ctx->sig->sig_sge.length = ctx->sig->data.sge.length;
4430e353e34SChristoph Hellwig 	if (sig_attrs->wire.sig_type != IB_SIG_TYPE_NONE)
4440e353e34SChristoph Hellwig 		ctx->sig->sig_sge.length += ctx->sig->prot.sge.length;
4450e353e34SChristoph Hellwig 
4460e353e34SChristoph Hellwig 	rdma_wr = &ctx->sig->data.wr;
4470e353e34SChristoph Hellwig 	rdma_wr->wr.sg_list = &ctx->sig->sig_sge;
4480e353e34SChristoph Hellwig 	rdma_wr->wr.num_sge = 1;
4490e353e34SChristoph Hellwig 	rdma_wr->remote_addr = remote_addr;
4500e353e34SChristoph Hellwig 	rdma_wr->rkey = rkey;
4510e353e34SChristoph Hellwig 	if (dir == DMA_TO_DEVICE)
4520e353e34SChristoph Hellwig 		rdma_wr->wr.opcode = IB_WR_RDMA_WRITE;
4530e353e34SChristoph Hellwig 	else
4540e353e34SChristoph Hellwig 		rdma_wr->wr.opcode = IB_WR_RDMA_READ;
4550e353e34SChristoph Hellwig 	prev_wr->next = &rdma_wr->wr;
4560e353e34SChristoph Hellwig 	prev_wr = &rdma_wr->wr;
4570e353e34SChristoph Hellwig 	count++;
4580e353e34SChristoph Hellwig 
4590e353e34SChristoph Hellwig 	return count;
4600e353e34SChristoph Hellwig 
4610e353e34SChristoph Hellwig out_destroy_prot_mr:
4620e353e34SChristoph Hellwig 	if (prot_sg_cnt)
4630e353e34SChristoph Hellwig 		ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->sig->prot.mr);
4640e353e34SChristoph Hellwig out_destroy_data_mr:
4650e353e34SChristoph Hellwig 	ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->sig->data.mr);
4660e353e34SChristoph Hellwig out_free_ctx:
4670e353e34SChristoph Hellwig 	kfree(ctx->sig);
4680e353e34SChristoph Hellwig out_unmap_prot_sg:
4690e353e34SChristoph Hellwig 	ib_dma_unmap_sg(dev, prot_sg, prot_sg_cnt, dir);
4700e353e34SChristoph Hellwig out_unmap_sg:
4710e353e34SChristoph Hellwig 	ib_dma_unmap_sg(dev, sg, sg_cnt, dir);
4720e353e34SChristoph Hellwig 	return ret;
4730e353e34SChristoph Hellwig }
4740e353e34SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_signature_init);
4750e353e34SChristoph Hellwig 
476a060b562SChristoph Hellwig /*
477a060b562SChristoph Hellwig  * Now that we are going to post the WRs we can update the lkey and need_inval
478a060b562SChristoph Hellwig  * state on the MRs.  If we were doing this at init time, we would get double
479a060b562SChristoph Hellwig  * or missing invalidations if a context was initialized but not actually
480a060b562SChristoph Hellwig  * posted.
481a060b562SChristoph Hellwig  */
482a060b562SChristoph Hellwig static void rdma_rw_update_lkey(struct rdma_rw_reg_ctx *reg, bool need_inval)
483a060b562SChristoph Hellwig {
484a060b562SChristoph Hellwig 	reg->mr->need_inval = need_inval;
485a060b562SChristoph Hellwig 	ib_update_fast_reg_key(reg->mr, ib_inc_rkey(reg->mr->lkey));
486a060b562SChristoph Hellwig 	reg->reg_wr.key = reg->mr->lkey;
487a060b562SChristoph Hellwig 	reg->sge.lkey = reg->mr->lkey;
488a060b562SChristoph Hellwig }
489a060b562SChristoph Hellwig 
490a060b562SChristoph Hellwig /**
491a060b562SChristoph Hellwig  * rdma_rw_ctx_wrs - return chain of WRs for a RDMA READ or WRITE operation
492a060b562SChristoph Hellwig  * @ctx:	context to operate on
493a060b562SChristoph Hellwig  * @qp:		queue pair to operate on
494a060b562SChristoph Hellwig  * @port_num:	port num to which the connection is bound
495a060b562SChristoph Hellwig  * @cqe:	completion queue entry for the last WR
496a060b562SChristoph Hellwig  * @chain_wr:	WR to append to the posted chain
497a060b562SChristoph Hellwig  *
498a060b562SChristoph Hellwig  * Return the WR chain for the set of RDMA READ/WRITE operations described by
499a060b562SChristoph Hellwig  * @ctx, as well as any memory registration operations needed.  If @chain_wr
500a060b562SChristoph Hellwig  * is non-NULL the WR it points to will be appended to the chain of WRs posted.
501a060b562SChristoph Hellwig  * If @chain_wr is not set @cqe must be set so that the caller gets a
502a060b562SChristoph Hellwig  * completion notification.
503a060b562SChristoph Hellwig  */
504a060b562SChristoph Hellwig struct ib_send_wr *rdma_rw_ctx_wrs(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
505a060b562SChristoph Hellwig 		u8 port_num, struct ib_cqe *cqe, struct ib_send_wr *chain_wr)
506a060b562SChristoph Hellwig {
507a060b562SChristoph Hellwig 	struct ib_send_wr *first_wr, *last_wr;
508a060b562SChristoph Hellwig 	int i;
509a060b562SChristoph Hellwig 
510a060b562SChristoph Hellwig 	switch (ctx->type) {
5110e353e34SChristoph Hellwig 	case RDMA_RW_SIG_MR:
5120e353e34SChristoph Hellwig 		rdma_rw_update_lkey(&ctx->sig->data, true);
5130e353e34SChristoph Hellwig 		if (ctx->sig->prot.mr)
5140e353e34SChristoph Hellwig 			rdma_rw_update_lkey(&ctx->sig->prot, true);
5150e353e34SChristoph Hellwig 
5160e353e34SChristoph Hellwig 		ctx->sig->sig_mr->need_inval = true;
5170e353e34SChristoph Hellwig 		ib_update_fast_reg_key(ctx->sig->sig_mr,
5180e353e34SChristoph Hellwig 			ib_inc_rkey(ctx->sig->sig_mr->lkey));
5190e353e34SChristoph Hellwig 		ctx->sig->sig_sge.lkey = ctx->sig->sig_mr->lkey;
5200e353e34SChristoph Hellwig 
5210e353e34SChristoph Hellwig 		if (ctx->sig->data.inv_wr.next)
5220e353e34SChristoph Hellwig 			first_wr = &ctx->sig->data.inv_wr;
5230e353e34SChristoph Hellwig 		else
5240e353e34SChristoph Hellwig 			first_wr = &ctx->sig->data.reg_wr.wr;
5250e353e34SChristoph Hellwig 		last_wr = &ctx->sig->data.wr.wr;
5260e353e34SChristoph Hellwig 		break;
527a060b562SChristoph Hellwig 	case RDMA_RW_MR:
528a060b562SChristoph Hellwig 		for (i = 0; i < ctx->nr_ops; i++) {
529a060b562SChristoph Hellwig 			rdma_rw_update_lkey(&ctx->reg[i],
530a060b562SChristoph Hellwig 				ctx->reg[i].wr.wr.opcode !=
531a060b562SChristoph Hellwig 					IB_WR_RDMA_READ_WITH_INV);
532a060b562SChristoph Hellwig 		}
533a060b562SChristoph Hellwig 
534a060b562SChristoph Hellwig 		if (ctx->reg[0].inv_wr.next)
535a060b562SChristoph Hellwig 			first_wr = &ctx->reg[0].inv_wr;
536a060b562SChristoph Hellwig 		else
537a060b562SChristoph Hellwig 			first_wr = &ctx->reg[0].reg_wr.wr;
538a060b562SChristoph Hellwig 		last_wr = &ctx->reg[ctx->nr_ops - 1].wr.wr;
539a060b562SChristoph Hellwig 		break;
540a060b562SChristoph Hellwig 	case RDMA_RW_MULTI_WR:
541a060b562SChristoph Hellwig 		first_wr = &ctx->map.wrs[0].wr;
542a060b562SChristoph Hellwig 		last_wr = &ctx->map.wrs[ctx->nr_ops - 1].wr;
543a060b562SChristoph Hellwig 		break;
544a060b562SChristoph Hellwig 	case RDMA_RW_SINGLE_WR:
545a060b562SChristoph Hellwig 		first_wr = &ctx->single.wr.wr;
546a060b562SChristoph Hellwig 		last_wr = &ctx->single.wr.wr;
547a060b562SChristoph Hellwig 		break;
548a060b562SChristoph Hellwig 	default:
549a060b562SChristoph Hellwig 		BUG();
550a060b562SChristoph Hellwig 	}
551a060b562SChristoph Hellwig 
552a060b562SChristoph Hellwig 	if (chain_wr) {
553a060b562SChristoph Hellwig 		last_wr->next = chain_wr;
554a060b562SChristoph Hellwig 	} else {
555a060b562SChristoph Hellwig 		last_wr->wr_cqe = cqe;
556a060b562SChristoph Hellwig 		last_wr->send_flags |= IB_SEND_SIGNALED;
557a060b562SChristoph Hellwig 	}
558a060b562SChristoph Hellwig 
559a060b562SChristoph Hellwig 	return first_wr;
560a060b562SChristoph Hellwig }
561a060b562SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_wrs);
562a060b562SChristoph Hellwig 
563a060b562SChristoph Hellwig /**
564a060b562SChristoph Hellwig  * rdma_rw_ctx_post - post a RDMA READ or RDMA WRITE operation
565a060b562SChristoph Hellwig  * @ctx:	context to operate on
566a060b562SChristoph Hellwig  * @qp:		queue pair to operate on
567a060b562SChristoph Hellwig  * @port_num:	port num to which the connection is bound
568a060b562SChristoph Hellwig  * @cqe:	completion queue entry for the last WR
569a060b562SChristoph Hellwig  * @chain_wr:	WR to append to the posted chain
570a060b562SChristoph Hellwig  *
571a060b562SChristoph Hellwig  * Post the set of RDMA READ/WRITE operations described by @ctx, as well as
572a060b562SChristoph Hellwig  * any memory registration operations needed.  If @chain_wr is non-NULL the
573a060b562SChristoph Hellwig  * WR it points to will be appended to the chain of WRs posted.  If @chain_wr
574a060b562SChristoph Hellwig  * is not set @cqe must be set so that the caller gets a completion
575a060b562SChristoph Hellwig  * notification.
576a060b562SChristoph Hellwig  */
577a060b562SChristoph Hellwig int rdma_rw_ctx_post(struct rdma_rw_ctx *ctx, struct ib_qp *qp, u8 port_num,
578a060b562SChristoph Hellwig 		struct ib_cqe *cqe, struct ib_send_wr *chain_wr)
579a060b562SChristoph Hellwig {
5801fec77bfSBart Van Assche 	struct ib_send_wr *first_wr;
581a060b562SChristoph Hellwig 
582a060b562SChristoph Hellwig 	first_wr = rdma_rw_ctx_wrs(ctx, qp, port_num, cqe, chain_wr);
5831fec77bfSBart Van Assche 	return ib_post_send(qp, first_wr, NULL);
584a060b562SChristoph Hellwig }
585a060b562SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_post);
586a060b562SChristoph Hellwig 
587a060b562SChristoph Hellwig /**
588a060b562SChristoph Hellwig  * rdma_rw_ctx_destroy - release all resources allocated by rdma_rw_ctx_init
589a060b562SChristoph Hellwig  * @ctx:	context to release
590a060b562SChristoph Hellwig  * @qp:		queue pair to operate on
591a060b562SChristoph Hellwig  * @port_num:	port num to which the connection is bound
592a060b562SChristoph Hellwig  * @sg:		scatterlist that was used for the READ/WRITE
593a060b562SChristoph Hellwig  * @sg_cnt:	number of entries in @sg
594a060b562SChristoph Hellwig  * @dir:	%DMA_TO_DEVICE for RDMA WRITE, %DMA_FROM_DEVICE for RDMA READ
595a060b562SChristoph Hellwig  */
596a060b562SChristoph Hellwig void rdma_rw_ctx_destroy(struct rdma_rw_ctx *ctx, struct ib_qp *qp, u8 port_num,
597a060b562SChristoph Hellwig 		struct scatterlist *sg, u32 sg_cnt, enum dma_data_direction dir)
598a060b562SChristoph Hellwig {
599a060b562SChristoph Hellwig 	int i;
600a060b562SChristoph Hellwig 
601a060b562SChristoph Hellwig 	switch (ctx->type) {
602a060b562SChristoph Hellwig 	case RDMA_RW_MR:
603a060b562SChristoph Hellwig 		for (i = 0; i < ctx->nr_ops; i++)
604a060b562SChristoph Hellwig 			ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->reg[i].mr);
605a060b562SChristoph Hellwig 		kfree(ctx->reg);
606a060b562SChristoph Hellwig 		break;
607a060b562SChristoph Hellwig 	case RDMA_RW_MULTI_WR:
608a060b562SChristoph Hellwig 		kfree(ctx->map.wrs);
609a060b562SChristoph Hellwig 		kfree(ctx->map.sges);
610a060b562SChristoph Hellwig 		break;
611a060b562SChristoph Hellwig 	case RDMA_RW_SINGLE_WR:
612a060b562SChristoph Hellwig 		break;
613a060b562SChristoph Hellwig 	default:
614a060b562SChristoph Hellwig 		BUG();
615a060b562SChristoph Hellwig 		break;
616a060b562SChristoph Hellwig 	}
617a060b562SChristoph Hellwig 
61850b7d220SLogan Gunthorpe 	/* P2PDMA contexts do not need to be unmapped */
61950b7d220SLogan Gunthorpe 	if (!is_pci_p2pdma_page(sg_page(sg)))
620a060b562SChristoph Hellwig 		ib_dma_unmap_sg(qp->pd->device, sg, sg_cnt, dir);
621a060b562SChristoph Hellwig }
622a060b562SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_destroy);
623a060b562SChristoph Hellwig 
6240e353e34SChristoph Hellwig /**
6250e353e34SChristoph Hellwig  * rdma_rw_ctx_destroy_signature - release all resources allocated by
6262d465a16SIsrael Rukshin  *	rdma_rw_ctx_signature_init
6270e353e34SChristoph Hellwig  * @ctx:	context to release
6280e353e34SChristoph Hellwig  * @qp:		queue pair to operate on
6290e353e34SChristoph Hellwig  * @port_num:	port num to which the connection is bound
6300e353e34SChristoph Hellwig  * @sg:		scatterlist that was used for the READ/WRITE
6310e353e34SChristoph Hellwig  * @sg_cnt:	number of entries in @sg
6320e353e34SChristoph Hellwig  * @prot_sg:	scatterlist that was used for the READ/WRITE of the PI
6330e353e34SChristoph Hellwig  * @prot_sg_cnt: number of entries in @prot_sg
6340e353e34SChristoph Hellwig  * @dir:	%DMA_TO_DEVICE for RDMA WRITE, %DMA_FROM_DEVICE for RDMA READ
6350e353e34SChristoph Hellwig  */
6360e353e34SChristoph Hellwig void rdma_rw_ctx_destroy_signature(struct rdma_rw_ctx *ctx, struct ib_qp *qp,
6370e353e34SChristoph Hellwig 		u8 port_num, struct scatterlist *sg, u32 sg_cnt,
6380e353e34SChristoph Hellwig 		struct scatterlist *prot_sg, u32 prot_sg_cnt,
6390e353e34SChristoph Hellwig 		enum dma_data_direction dir)
6400e353e34SChristoph Hellwig {
6410e353e34SChristoph Hellwig 	if (WARN_ON_ONCE(ctx->type != RDMA_RW_SIG_MR))
6420e353e34SChristoph Hellwig 		return;
6430e353e34SChristoph Hellwig 
6440e353e34SChristoph Hellwig 	ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->sig->data.mr);
6450e353e34SChristoph Hellwig 	ib_dma_unmap_sg(qp->pd->device, sg, sg_cnt, dir);
6460e353e34SChristoph Hellwig 
6470e353e34SChristoph Hellwig 	if (ctx->sig->prot.mr) {
6480e353e34SChristoph Hellwig 		ib_mr_pool_put(qp, &qp->rdma_mrs, ctx->sig->prot.mr);
6490e353e34SChristoph Hellwig 		ib_dma_unmap_sg(qp->pd->device, prot_sg, prot_sg_cnt, dir);
6500e353e34SChristoph Hellwig 	}
6510e353e34SChristoph Hellwig 
6520e353e34SChristoph Hellwig 	ib_mr_pool_put(qp, &qp->sig_mrs, ctx->sig->sig_mr);
6530e353e34SChristoph Hellwig 	kfree(ctx->sig);
6540e353e34SChristoph Hellwig }
6550e353e34SChristoph Hellwig EXPORT_SYMBOL(rdma_rw_ctx_destroy_signature);
6560e353e34SChristoph Hellwig 
65700628182SChuck Lever /**
65800628182SChuck Lever  * rdma_rw_mr_factor - return number of MRs required for a payload
65900628182SChuck Lever  * @device:	device handling the connection
66000628182SChuck Lever  * @port_num:	port num to which the connection is bound
66100628182SChuck Lever  * @maxpages:	maximum payload pages per rdma_rw_ctx
66200628182SChuck Lever  *
66300628182SChuck Lever  * Returns the number of MRs the device requires to move @maxpayload
66400628182SChuck Lever  * bytes. The returned value is used during transport creation to
66500628182SChuck Lever  * compute max_rdma_ctxts and the size of the transport's Send and
66600628182SChuck Lever  * Send Completion Queues.
66700628182SChuck Lever  */
66800628182SChuck Lever unsigned int rdma_rw_mr_factor(struct ib_device *device, u8 port_num,
66900628182SChuck Lever 			       unsigned int maxpages)
67000628182SChuck Lever {
67100628182SChuck Lever 	unsigned int mr_pages;
67200628182SChuck Lever 
67300628182SChuck Lever 	if (rdma_rw_can_use_mr(device, port_num))
67400628182SChuck Lever 		mr_pages = rdma_rw_fr_page_list_len(device);
67500628182SChuck Lever 	else
67600628182SChuck Lever 		mr_pages = device->attrs.max_sge_rd;
67700628182SChuck Lever 	return DIV_ROUND_UP(maxpages, mr_pages);
67800628182SChuck Lever }
67900628182SChuck Lever EXPORT_SYMBOL(rdma_rw_mr_factor);
68000628182SChuck Lever 
681a060b562SChristoph Hellwig void rdma_rw_init_qp(struct ib_device *dev, struct ib_qp_init_attr *attr)
682a060b562SChristoph Hellwig {
683a060b562SChristoph Hellwig 	u32 factor;
684a060b562SChristoph Hellwig 
685a060b562SChristoph Hellwig 	WARN_ON_ONCE(attr->port_num == 0);
686a060b562SChristoph Hellwig 
687a060b562SChristoph Hellwig 	/*
688a060b562SChristoph Hellwig 	 * Each context needs at least one RDMA READ or WRITE WR.
689a060b562SChristoph Hellwig 	 *
690a060b562SChristoph Hellwig 	 * For some hardware we might need more, eventually we should ask the
691a060b562SChristoph Hellwig 	 * HCA driver for a multiplier here.
692a060b562SChristoph Hellwig 	 */
693a060b562SChristoph Hellwig 	factor = 1;
694a060b562SChristoph Hellwig 
695a060b562SChristoph Hellwig 	/*
696a060b562SChristoph Hellwig 	 * If the devices needs MRs to perform RDMA READ or WRITE operations,
697a060b562SChristoph Hellwig 	 * we'll need two additional MRs for the registrations and the
698a060b562SChristoph Hellwig 	 * invalidation.
699a060b562SChristoph Hellwig 	 */
700c0a6cbb9SIsrael Rukshin 	if (attr->create_flags & IB_QP_CREATE_INTEGRITY_EN)
7010e353e34SChristoph Hellwig 		factor += 6;	/* (inv + reg) * (data + prot + sig) */
7020e353e34SChristoph Hellwig 	else if (rdma_rw_can_use_mr(dev, attr->port_num))
703a060b562SChristoph Hellwig 		factor += 2;	/* inv + reg */
704a060b562SChristoph Hellwig 
705a060b562SChristoph Hellwig 	attr->cap.max_send_wr += factor * attr->cap.max_rdma_ctxs;
706a060b562SChristoph Hellwig 
707a060b562SChristoph Hellwig 	/*
708a060b562SChristoph Hellwig 	 * But maybe we were just too high in the sky and the device doesn't
709a060b562SChristoph Hellwig 	 * even support all we need, and we'll have to live with what we get..
710a060b562SChristoph Hellwig 	 */
711a060b562SChristoph Hellwig 	attr->cap.max_send_wr =
712a060b562SChristoph Hellwig 		min_t(u32, attr->cap.max_send_wr, dev->attrs.max_qp_wr);
713a060b562SChristoph Hellwig }
714a060b562SChristoph Hellwig 
715a060b562SChristoph Hellwig int rdma_rw_init_mrs(struct ib_qp *qp, struct ib_qp_init_attr *attr)
716a060b562SChristoph Hellwig {
717a060b562SChristoph Hellwig 	struct ib_device *dev = qp->pd->device;
7180e353e34SChristoph Hellwig 	u32 nr_mrs = 0, nr_sig_mrs = 0;
719a060b562SChristoph Hellwig 	int ret = 0;
720a060b562SChristoph Hellwig 
721c0a6cbb9SIsrael Rukshin 	if (attr->create_flags & IB_QP_CREATE_INTEGRITY_EN) {
7220e353e34SChristoph Hellwig 		nr_sig_mrs = attr->cap.max_rdma_ctxs;
7230e353e34SChristoph Hellwig 		nr_mrs = attr->cap.max_rdma_ctxs * 2;
7240e353e34SChristoph Hellwig 	} else if (rdma_rw_can_use_mr(dev, attr->port_num)) {
7250e353e34SChristoph Hellwig 		nr_mrs = attr->cap.max_rdma_ctxs;
726a060b562SChristoph Hellwig 	}
727a060b562SChristoph Hellwig 
7280e353e34SChristoph Hellwig 	if (nr_mrs) {
7290e353e34SChristoph Hellwig 		ret = ib_mr_pool_init(qp, &qp->rdma_mrs, nr_mrs,
7300e353e34SChristoph Hellwig 				IB_MR_TYPE_MEM_REG,
7315a6781a5SIsrael Rukshin 				rdma_rw_fr_page_list_len(dev), 0);
7320e353e34SChristoph Hellwig 		if (ret) {
7330e353e34SChristoph Hellwig 			pr_err("%s: failed to allocated %d MRs\n",
7340e353e34SChristoph Hellwig 				__func__, nr_mrs);
7350e353e34SChristoph Hellwig 			return ret;
7360e353e34SChristoph Hellwig 		}
7370e353e34SChristoph Hellwig 	}
7380e353e34SChristoph Hellwig 
7390e353e34SChristoph Hellwig 	if (nr_sig_mrs) {
7400e353e34SChristoph Hellwig 		ret = ib_mr_pool_init(qp, &qp->sig_mrs, nr_sig_mrs,
7415a6781a5SIsrael Rukshin 				IB_MR_TYPE_SIGNATURE, 2, 0);
7420e353e34SChristoph Hellwig 		if (ret) {
7430e353e34SChristoph Hellwig 			pr_err("%s: failed to allocated %d SIG MRs\n",
744f73e4076SIsrael Rukshin 				__func__, nr_sig_mrs);
7450e353e34SChristoph Hellwig 			goto out_free_rdma_mrs;
7460e353e34SChristoph Hellwig 		}
7470e353e34SChristoph Hellwig 	}
7480e353e34SChristoph Hellwig 
7490e353e34SChristoph Hellwig 	return 0;
7500e353e34SChristoph Hellwig 
7510e353e34SChristoph Hellwig out_free_rdma_mrs:
7520e353e34SChristoph Hellwig 	ib_mr_pool_destroy(qp, &qp->rdma_mrs);
753a060b562SChristoph Hellwig 	return ret;
754a060b562SChristoph Hellwig }
755a060b562SChristoph Hellwig 
756a060b562SChristoph Hellwig void rdma_rw_cleanup_mrs(struct ib_qp *qp)
757a060b562SChristoph Hellwig {
7580e353e34SChristoph Hellwig 	ib_mr_pool_destroy(qp, &qp->sig_mrs);
759a060b562SChristoph Hellwig 	ib_mr_pool_destroy(qp, &qp->rdma_mrs);
760a060b562SChristoph Hellwig }
761