xref: /openbmc/linux/drivers/infiniband/hw/erdma/erdma_main.c (revision 1ac731c529cd4d6adbce134754b51ff7d822b145)
1d55e6fb4SCheng Xu // SPDX-License-Identifier: GPL-2.0 OR BSD-3-Clause
2d55e6fb4SCheng Xu 
3d55e6fb4SCheng Xu /* Authors: Cheng Xu <chengyou@linux.alibaba.com> */
4d55e6fb4SCheng Xu /*          Kai Shen <kaishen@linux.alibaba.com> */
5d55e6fb4SCheng Xu /* Copyright (c) 2020-2022, Alibaba Group. */
6d55e6fb4SCheng Xu 
7d55e6fb4SCheng Xu #include <linux/module.h>
8d55e6fb4SCheng Xu #include <net/addrconf.h>
9d55e6fb4SCheng Xu #include <rdma/erdma-abi.h>
10d55e6fb4SCheng Xu 
11d55e6fb4SCheng Xu #include "erdma.h"
12d55e6fb4SCheng Xu #include "erdma_cm.h"
13d55e6fb4SCheng Xu #include "erdma_verbs.h"
14d55e6fb4SCheng Xu 
15d55e6fb4SCheng Xu MODULE_AUTHOR("Cheng Xu <chengyou@linux.alibaba.com>");
16d55e6fb4SCheng Xu MODULE_DESCRIPTION("Alibaba elasticRDMA adapter driver");
17d55e6fb4SCheng Xu MODULE_LICENSE("Dual BSD/GPL");
18d55e6fb4SCheng Xu 
erdma_netdev_event(struct notifier_block * nb,unsigned long event,void * arg)19d55e6fb4SCheng Xu static int erdma_netdev_event(struct notifier_block *nb, unsigned long event,
20d55e6fb4SCheng Xu 			      void *arg)
21d55e6fb4SCheng Xu {
22d55e6fb4SCheng Xu 	struct net_device *netdev = netdev_notifier_info_to_dev(arg);
23d55e6fb4SCheng Xu 	struct erdma_dev *dev = container_of(nb, struct erdma_dev, netdev_nb);
24d55e6fb4SCheng Xu 
25d55e6fb4SCheng Xu 	if (dev->netdev == NULL || dev->netdev != netdev)
26d55e6fb4SCheng Xu 		goto done;
27d55e6fb4SCheng Xu 
28d55e6fb4SCheng Xu 	switch (event) {
29d55e6fb4SCheng Xu 	case NETDEV_UP:
30d55e6fb4SCheng Xu 		dev->state = IB_PORT_ACTIVE;
31d55e6fb4SCheng Xu 		erdma_port_event(dev, IB_EVENT_PORT_ACTIVE);
32d55e6fb4SCheng Xu 		break;
33d55e6fb4SCheng Xu 	case NETDEV_DOWN:
34d55e6fb4SCheng Xu 		dev->state = IB_PORT_DOWN;
35d55e6fb4SCheng Xu 		erdma_port_event(dev, IB_EVENT_PORT_ERR);
36d55e6fb4SCheng Xu 		break;
379bdb9350SCheng Xu 	case NETDEV_CHANGEMTU:
389bdb9350SCheng Xu 		if (dev->mtu != netdev->mtu) {
399bdb9350SCheng Xu 			erdma_set_mtu(dev, netdev->mtu);
409bdb9350SCheng Xu 			dev->mtu = netdev->mtu;
419bdb9350SCheng Xu 		}
429bdb9350SCheng Xu 		break;
43d55e6fb4SCheng Xu 	case NETDEV_REGISTER:
44d55e6fb4SCheng Xu 	case NETDEV_UNREGISTER:
45d55e6fb4SCheng Xu 	case NETDEV_CHANGEADDR:
46d55e6fb4SCheng Xu 	case NETDEV_GOING_DOWN:
47d55e6fb4SCheng Xu 	case NETDEV_CHANGE:
48d55e6fb4SCheng Xu 	default:
49d55e6fb4SCheng Xu 		break;
50d55e6fb4SCheng Xu 	}
51d55e6fb4SCheng Xu 
52d55e6fb4SCheng Xu done:
53d55e6fb4SCheng Xu 	return NOTIFY_OK;
54d55e6fb4SCheng Xu }
55d55e6fb4SCheng Xu 
erdma_enum_and_get_netdev(struct erdma_dev * dev)56d55e6fb4SCheng Xu static int erdma_enum_and_get_netdev(struct erdma_dev *dev)
57d55e6fb4SCheng Xu {
58d55e6fb4SCheng Xu 	struct net_device *netdev;
596bd1bca8SCheng Xu 	int ret = -EPROBE_DEFER;
60d55e6fb4SCheng Xu 
61d55e6fb4SCheng Xu 	/* Already binded to a net_device, so we skip. */
62d55e6fb4SCheng Xu 	if (dev->netdev)
63d55e6fb4SCheng Xu 		return 0;
64d55e6fb4SCheng Xu 
65d55e6fb4SCheng Xu 	rtnl_lock();
66d55e6fb4SCheng Xu 	for_each_netdev(&init_net, netdev) {
67d55e6fb4SCheng Xu 		/*
68d55e6fb4SCheng Xu 		 * In erdma, the paired netdev and ibdev should have the same
69d55e6fb4SCheng Xu 		 * MAC address. erdma can get the value from its PCIe bar
70d55e6fb4SCheng Xu 		 * registers. Since erdma can not get the paired netdev
71d55e6fb4SCheng Xu 		 * reference directly, we do a traverse here to get the paired
72d55e6fb4SCheng Xu 		 * netdev.
73d55e6fb4SCheng Xu 		 */
74d55e6fb4SCheng Xu 		if (ether_addr_equal_unaligned(netdev->perm_addr,
75d55e6fb4SCheng Xu 					       dev->attrs.peer_addr)) {
76d55e6fb4SCheng Xu 			ret = ib_device_set_netdev(&dev->ibdev, netdev, 1);
77d55e6fb4SCheng Xu 			if (ret) {
78d55e6fb4SCheng Xu 				rtnl_unlock();
79d55e6fb4SCheng Xu 				ibdev_warn(&dev->ibdev,
80d55e6fb4SCheng Xu 					   "failed (%d) to link netdev", ret);
81d55e6fb4SCheng Xu 				return ret;
82d55e6fb4SCheng Xu 			}
83d55e6fb4SCheng Xu 
84d55e6fb4SCheng Xu 			dev->netdev = netdev;
85d55e6fb4SCheng Xu 			break;
86d55e6fb4SCheng Xu 		}
87d55e6fb4SCheng Xu 	}
88d55e6fb4SCheng Xu 
89d55e6fb4SCheng Xu 	rtnl_unlock();
90d55e6fb4SCheng Xu 
91d55e6fb4SCheng Xu 	return ret;
92d55e6fb4SCheng Xu }
93d55e6fb4SCheng Xu 
erdma_device_register(struct erdma_dev * dev)94d55e6fb4SCheng Xu static int erdma_device_register(struct erdma_dev *dev)
95d55e6fb4SCheng Xu {
96d55e6fb4SCheng Xu 	struct ib_device *ibdev = &dev->ibdev;
97d55e6fb4SCheng Xu 	int ret;
98d55e6fb4SCheng Xu 
99d55e6fb4SCheng Xu 	ret = erdma_enum_and_get_netdev(dev);
100d55e6fb4SCheng Xu 	if (ret)
101d55e6fb4SCheng Xu 		return ret;
102d55e6fb4SCheng Xu 
1039bdb9350SCheng Xu 	dev->mtu = dev->netdev->mtu;
104d55e6fb4SCheng Xu 	addrconf_addr_eui48((u8 *)&ibdev->node_guid, dev->netdev->dev_addr);
105d55e6fb4SCheng Xu 
106d55e6fb4SCheng Xu 	ret = ib_register_device(ibdev, "erdma_%d", &dev->pdev->dev);
107d55e6fb4SCheng Xu 	if (ret) {
108d55e6fb4SCheng Xu 		dev_err(&dev->pdev->dev,
109d55e6fb4SCheng Xu 			"ib_register_device failed: ret = %d\n", ret);
110d55e6fb4SCheng Xu 		return ret;
111d55e6fb4SCheng Xu 	}
112d55e6fb4SCheng Xu 
113d55e6fb4SCheng Xu 	dev->netdev_nb.notifier_call = erdma_netdev_event;
114d55e6fb4SCheng Xu 	ret = register_netdevice_notifier(&dev->netdev_nb);
115d55e6fb4SCheng Xu 	if (ret) {
116d55e6fb4SCheng Xu 		ibdev_err(&dev->ibdev, "failed to register notifier.\n");
117d55e6fb4SCheng Xu 		ib_unregister_device(ibdev);
118d55e6fb4SCheng Xu 	}
119d55e6fb4SCheng Xu 
120d55e6fb4SCheng Xu 	return ret;
121d55e6fb4SCheng Xu }
122d55e6fb4SCheng Xu 
erdma_comm_irq_handler(int irq,void * data)123d55e6fb4SCheng Xu static irqreturn_t erdma_comm_irq_handler(int irq, void *data)
124d55e6fb4SCheng Xu {
125d55e6fb4SCheng Xu 	struct erdma_dev *dev = data;
126d55e6fb4SCheng Xu 
127d55e6fb4SCheng Xu 	erdma_cmdq_completion_handler(&dev->cmdq);
128d55e6fb4SCheng Xu 	erdma_aeq_event_handler(dev);
129d55e6fb4SCheng Xu 
130d55e6fb4SCheng Xu 	return IRQ_HANDLED;
131d55e6fb4SCheng Xu }
132d55e6fb4SCheng Xu 
erdma_request_vectors(struct erdma_dev * dev)133d55e6fb4SCheng Xu static int erdma_request_vectors(struct erdma_dev *dev)
134d55e6fb4SCheng Xu {
135d55e6fb4SCheng Xu 	int expect_irq_num = min(num_possible_cpus() + 1, ERDMA_NUM_MSIX_VEC);
136d55e6fb4SCheng Xu 	int ret;
137d55e6fb4SCheng Xu 
138d55e6fb4SCheng Xu 	ret = pci_alloc_irq_vectors(dev->pdev, 1, expect_irq_num, PCI_IRQ_MSIX);
139d55e6fb4SCheng Xu 	if (ret < 0) {
140d55e6fb4SCheng Xu 		dev_err(&dev->pdev->dev, "request irq vectors failed(%d)\n",
141d55e6fb4SCheng Xu 			ret);
142d55e6fb4SCheng Xu 		return ret;
143d55e6fb4SCheng Xu 	}
144d55e6fb4SCheng Xu 	dev->attrs.irq_num = ret;
145d55e6fb4SCheng Xu 
146d55e6fb4SCheng Xu 	return 0;
147d55e6fb4SCheng Xu }
148d55e6fb4SCheng Xu 
erdma_comm_irq_init(struct erdma_dev * dev)149d55e6fb4SCheng Xu static int erdma_comm_irq_init(struct erdma_dev *dev)
150d55e6fb4SCheng Xu {
151d55e6fb4SCheng Xu 	snprintf(dev->comm_irq.name, ERDMA_IRQNAME_SIZE, "erdma-common@pci:%s",
152d55e6fb4SCheng Xu 		 pci_name(dev->pdev));
153d55e6fb4SCheng Xu 	dev->comm_irq.msix_vector =
154d55e6fb4SCheng Xu 		pci_irq_vector(dev->pdev, ERDMA_MSIX_VECTOR_CMDQ);
155d55e6fb4SCheng Xu 
156d55e6fb4SCheng Xu 	cpumask_set_cpu(cpumask_first(cpumask_of_pcibus(dev->pdev->bus)),
157d55e6fb4SCheng Xu 			&dev->comm_irq.affinity_hint_mask);
158d55e6fb4SCheng Xu 	irq_set_affinity_hint(dev->comm_irq.msix_vector,
159d55e6fb4SCheng Xu 			      &dev->comm_irq.affinity_hint_mask);
160d55e6fb4SCheng Xu 
161d55e6fb4SCheng Xu 	return request_irq(dev->comm_irq.msix_vector, erdma_comm_irq_handler, 0,
162d55e6fb4SCheng Xu 			   dev->comm_irq.name, dev);
163d55e6fb4SCheng Xu }
164d55e6fb4SCheng Xu 
erdma_comm_irq_uninit(struct erdma_dev * dev)165d55e6fb4SCheng Xu static void erdma_comm_irq_uninit(struct erdma_dev *dev)
166d55e6fb4SCheng Xu {
167d55e6fb4SCheng Xu 	irq_set_affinity_hint(dev->comm_irq.msix_vector, NULL);
168d55e6fb4SCheng Xu 	free_irq(dev->comm_irq.msix_vector, dev);
169d55e6fb4SCheng Xu }
170d55e6fb4SCheng Xu 
erdma_device_init(struct erdma_dev * dev,struct pci_dev * pdev)171d55e6fb4SCheng Xu static int erdma_device_init(struct erdma_dev *dev, struct pci_dev *pdev)
172d55e6fb4SCheng Xu {
173d55e6fb4SCheng Xu 	int ret;
174d55e6fb4SCheng Xu 
175d55e6fb4SCheng Xu 	ret = dma_set_mask_and_coherent(&pdev->dev,
176d55e6fb4SCheng Xu 					DMA_BIT_MASK(ERDMA_PCI_WIDTH));
177d55e6fb4SCheng Xu 	if (ret)
178d55e6fb4SCheng Xu 		return ret;
179d55e6fb4SCheng Xu 
180d55e6fb4SCheng Xu 	dma_set_max_seg_size(&pdev->dev, UINT_MAX);
181d55e6fb4SCheng Xu 
182d55e6fb4SCheng Xu 	return 0;
183d55e6fb4SCheng Xu }
184d55e6fb4SCheng Xu 
erdma_hw_reset(struct erdma_dev * dev)185d55e6fb4SCheng Xu static void erdma_hw_reset(struct erdma_dev *dev)
186d55e6fb4SCheng Xu {
187d55e6fb4SCheng Xu 	u32 ctrl = FIELD_PREP(ERDMA_REG_DEV_CTRL_RESET_MASK, 1);
188d55e6fb4SCheng Xu 
189d55e6fb4SCheng Xu 	erdma_reg_write32(dev, ERDMA_REGS_DEV_CTRL_REG, ctrl);
190d55e6fb4SCheng Xu }
191d55e6fb4SCheng Xu 
erdma_wait_hw_init_done(struct erdma_dev * dev)192d55e6fb4SCheng Xu static int erdma_wait_hw_init_done(struct erdma_dev *dev)
193d55e6fb4SCheng Xu {
194d55e6fb4SCheng Xu 	int i;
195d55e6fb4SCheng Xu 
196d55e6fb4SCheng Xu 	erdma_reg_write32(dev, ERDMA_REGS_DEV_CTRL_REG,
197d55e6fb4SCheng Xu 			  FIELD_PREP(ERDMA_REG_DEV_CTRL_INIT_MASK, 1));
198d55e6fb4SCheng Xu 
199d55e6fb4SCheng Xu 	for (i = 0; i < ERDMA_WAIT_DEV_DONE_CNT; i++) {
200d55e6fb4SCheng Xu 		if (erdma_reg_read32_filed(dev, ERDMA_REGS_DEV_ST_REG,
201d55e6fb4SCheng Xu 					   ERDMA_REG_DEV_ST_INIT_DONE_MASK))
202d55e6fb4SCheng Xu 			break;
203d55e6fb4SCheng Xu 
204d55e6fb4SCheng Xu 		msleep(ERDMA_REG_ACCESS_WAIT_MS);
205d55e6fb4SCheng Xu 	}
206d55e6fb4SCheng Xu 
207d55e6fb4SCheng Xu 	if (i == ERDMA_WAIT_DEV_DONE_CNT) {
208d55e6fb4SCheng Xu 		dev_err(&dev->pdev->dev, "wait init done failed.\n");
209d55e6fb4SCheng Xu 		return -ETIMEDOUT;
210d55e6fb4SCheng Xu 	}
211d55e6fb4SCheng Xu 
212d55e6fb4SCheng Xu 	return 0;
213d55e6fb4SCheng Xu }
214*901d9d62SCheng Xu 
215d55e6fb4SCheng Xu static const struct pci_device_id erdma_pci_tbl[] = {
216d55e6fb4SCheng Xu 	{ PCI_DEVICE(PCI_VENDOR_ID_ALIBABA, 0x107f) },
217d55e6fb4SCheng Xu 	{}
218d55e6fb4SCheng Xu };
219d55e6fb4SCheng Xu 
erdma_probe_dev(struct pci_dev * pdev)220d55e6fb4SCheng Xu static int erdma_probe_dev(struct pci_dev *pdev)
221*901d9d62SCheng Xu {
222*901d9d62SCheng Xu 	struct erdma_dev *dev;
223*901d9d62SCheng Xu 	int bars, err;
224*901d9d62SCheng Xu 	u32 version;
225*901d9d62SCheng Xu 
226*901d9d62SCheng Xu 	err = pci_enable_device(pdev);
227*901d9d62SCheng Xu 	if (err) {
228*901d9d62SCheng Xu 		dev_err(&pdev->dev, "pci_enable_device failed(%d)\n", err);
229*901d9d62SCheng Xu 		return err;
230*901d9d62SCheng Xu 	}
231*901d9d62SCheng Xu 
232*901d9d62SCheng Xu 	pci_set_master(pdev);
233*901d9d62SCheng Xu 
234*901d9d62SCheng Xu 	dev = ib_alloc_device(erdma_dev, ibdev);
235*901d9d62SCheng Xu 	if (!dev) {
236*901d9d62SCheng Xu 		dev_err(&pdev->dev, "ib_alloc_device failed\n");
237*901d9d62SCheng Xu 		err = -ENOMEM;
238*901d9d62SCheng Xu 		goto err_disable_device;
239*901d9d62SCheng Xu 	}
240*901d9d62SCheng Xu 
241*901d9d62SCheng Xu 	pci_set_drvdata(pdev, dev);
242*901d9d62SCheng Xu 	dev->pdev = pdev;
243*901d9d62SCheng Xu 	dev->attrs.numa_node = dev_to_node(&pdev->dev);
244d55e6fb4SCheng Xu 
245d55e6fb4SCheng Xu 	bars = pci_select_bars(pdev, IORESOURCE_MEM);
246d55e6fb4SCheng Xu 	err = pci_request_selected_regions(pdev, bars, DRV_MODULE_NAME);
247d55e6fb4SCheng Xu 	if (bars != ERDMA_BAR_MASK || err) {
248d55e6fb4SCheng Xu 		err = err ? err : -EINVAL;
249d55e6fb4SCheng Xu 		goto err_ib_device_release;
250d55e6fb4SCheng Xu 	}
251d55e6fb4SCheng Xu 
252d55e6fb4SCheng Xu 	dev->func_bar_addr = pci_resource_start(pdev, ERDMA_FUNC_BAR);
253d55e6fb4SCheng Xu 	dev->func_bar_len = pci_resource_len(pdev, ERDMA_FUNC_BAR);
254d55e6fb4SCheng Xu 
255d55e6fb4SCheng Xu 	dev->func_bar =
256d55e6fb4SCheng Xu 		devm_ioremap(&pdev->dev, dev->func_bar_addr, dev->func_bar_len);
257d55e6fb4SCheng Xu 	if (!dev->func_bar) {
258d55e6fb4SCheng Xu 		dev_err(&pdev->dev, "devm_ioremap failed.\n");
259d55e6fb4SCheng Xu 		err = -EFAULT;
260d55e6fb4SCheng Xu 		goto err_release_bars;
261d55e6fb4SCheng Xu 	}
262d55e6fb4SCheng Xu 
263d55e6fb4SCheng Xu 	version = erdma_reg_read32(dev, ERDMA_REGS_VERSION_REG);
264d55e6fb4SCheng Xu 	if (version == 0) {
265d55e6fb4SCheng Xu 		/* we knows that it is a non-functional function. */
266d55e6fb4SCheng Xu 		err = -ENODEV;
267d55e6fb4SCheng Xu 		goto err_iounmap_func_bar;
268d55e6fb4SCheng Xu 	}
269d55e6fb4SCheng Xu 
270d55e6fb4SCheng Xu 	err = erdma_device_init(dev, pdev);
271d55e6fb4SCheng Xu 	if (err)
272d55e6fb4SCheng Xu 		goto err_iounmap_func_bar;
273d55e6fb4SCheng Xu 
274d55e6fb4SCheng Xu 	err = erdma_request_vectors(dev);
275d55e6fb4SCheng Xu 	if (err)
276d55e6fb4SCheng Xu 		goto err_iounmap_func_bar;
277d55e6fb4SCheng Xu 
278d55e6fb4SCheng Xu 	err = erdma_comm_irq_init(dev);
279d55e6fb4SCheng Xu 	if (err)
280d55e6fb4SCheng Xu 		goto err_free_vectors;
281d55e6fb4SCheng Xu 
282d55e6fb4SCheng Xu 	err = erdma_aeq_init(dev);
283d55e6fb4SCheng Xu 	if (err)
284d55e6fb4SCheng Xu 		goto err_uninit_comm_irq;
285d55e6fb4SCheng Xu 
286d55e6fb4SCheng Xu 	err = erdma_cmdq_init(dev);
287d55e6fb4SCheng Xu 	if (err)
288d55e6fb4SCheng Xu 		goto err_uninit_aeq;
289d55e6fb4SCheng Xu 
290d55e6fb4SCheng Xu 	err = erdma_wait_hw_init_done(dev);
291d55e6fb4SCheng Xu 	if (err)
292d55e6fb4SCheng Xu 		goto err_uninit_cmdq;
293d55e6fb4SCheng Xu 
294d55e6fb4SCheng Xu 	err = erdma_ceqs_init(dev);
295d55e6fb4SCheng Xu 	if (err)
296d55e6fb4SCheng Xu 		goto err_reset_hw;
297d55e6fb4SCheng Xu 
298d55e6fb4SCheng Xu 	erdma_finish_cmdq_init(dev);
299d55e6fb4SCheng Xu 
300d55e6fb4SCheng Xu 	return 0;
301d55e6fb4SCheng Xu 
302d55e6fb4SCheng Xu err_reset_hw:
303d55e6fb4SCheng Xu 	erdma_hw_reset(dev);
304d55e6fb4SCheng Xu 
305d55e6fb4SCheng Xu err_uninit_cmdq:
306d55e6fb4SCheng Xu 	erdma_cmdq_destroy(dev);
307d55e6fb4SCheng Xu 
308d55e6fb4SCheng Xu err_uninit_aeq:
309d55e6fb4SCheng Xu 	erdma_aeq_destroy(dev);
310d55e6fb4SCheng Xu 
311d55e6fb4SCheng Xu err_uninit_comm_irq:
312d55e6fb4SCheng Xu 	erdma_comm_irq_uninit(dev);
313d55e6fb4SCheng Xu 
314d55e6fb4SCheng Xu err_free_vectors:
315d55e6fb4SCheng Xu 	pci_free_irq_vectors(dev->pdev);
316d55e6fb4SCheng Xu 
317d55e6fb4SCheng Xu err_iounmap_func_bar:
318d55e6fb4SCheng Xu 	devm_iounmap(&pdev->dev, dev->func_bar);
319*901d9d62SCheng Xu 
320d55e6fb4SCheng Xu err_release_bars:
321d55e6fb4SCheng Xu 	pci_release_selected_regions(pdev, bars);
322d55e6fb4SCheng Xu 
323*901d9d62SCheng Xu err_ib_device_release:
324*901d9d62SCheng Xu 	ib_dealloc_device(&dev->ibdev);
325*901d9d62SCheng Xu 
326*901d9d62SCheng Xu err_disable_device:
327d55e6fb4SCheng Xu 	pci_disable_device(pdev);
328d55e6fb4SCheng Xu 
329d55e6fb4SCheng Xu 	return err;
330d55e6fb4SCheng Xu }
331*901d9d62SCheng Xu 
erdma_remove_dev(struct pci_dev * pdev)332*901d9d62SCheng Xu static void erdma_remove_dev(struct pci_dev *pdev)
333*901d9d62SCheng Xu {
334d55e6fb4SCheng Xu 	struct erdma_dev *dev = pci_get_drvdata(pdev);
335d55e6fb4SCheng Xu 
336d55e6fb4SCheng Xu 	erdma_ceqs_uninit(dev);
337d55e6fb4SCheng Xu 	erdma_hw_reset(dev);
338d55e6fb4SCheng Xu 	erdma_cmdq_destroy(dev);
339d55e6fb4SCheng Xu 	erdma_aeq_destroy(dev);
340d55e6fb4SCheng Xu 	erdma_comm_irq_uninit(dev);
341d55e6fb4SCheng Xu 	pci_free_irq_vectors(dev->pdev);
342d55e6fb4SCheng Xu 
343d55e6fb4SCheng Xu 	devm_iounmap(&pdev->dev, dev->func_bar);
344d55e6fb4SCheng Xu 	pci_release_selected_regions(pdev, ERDMA_BAR_MASK);
345d55e6fb4SCheng Xu 
346d55e6fb4SCheng Xu 	ib_dealloc_device(&dev->ibdev);
347d55e6fb4SCheng Xu 
348d55e6fb4SCheng Xu 	pci_disable_device(pdev);
349d55e6fb4SCheng Xu }
350d55e6fb4SCheng Xu 
351d55e6fb4SCheng Xu #define ERDMA_GET_CAP(name, cap) FIELD_GET(ERDMA_CMD_DEV_CAP_##name##_MASK, cap)
352d55e6fb4SCheng Xu 
erdma_dev_attrs_init(struct erdma_dev * dev)353d55e6fb4SCheng Xu static int erdma_dev_attrs_init(struct erdma_dev *dev)
354d55e6fb4SCheng Xu {
355d55e6fb4SCheng Xu 	int err;
356d55e6fb4SCheng Xu 	u64 req_hdr, cap0, cap1;
357d55e6fb4SCheng Xu 
358d55e6fb4SCheng Xu 	erdma_cmdq_build_reqhdr(&req_hdr, CMDQ_SUBMOD_RDMA,
359d55e6fb4SCheng Xu 				CMDQ_OPCODE_QUERY_DEVICE);
360d55e6fb4SCheng Xu 
361d55e6fb4SCheng Xu 	err = erdma_post_cmd_wait(&dev->cmdq, &req_hdr, sizeof(req_hdr), &cap0,
362d55e6fb4SCheng Xu 				  &cap1);
363d55e6fb4SCheng Xu 	if (err)
364d55e6fb4SCheng Xu 		return err;
365d55e6fb4SCheng Xu 
366*901d9d62SCheng Xu 	dev->attrs.max_cqe = 1 << ERDMA_GET_CAP(MAX_CQE, cap0);
367d55e6fb4SCheng Xu 	dev->attrs.max_mr_size = 1ULL << ERDMA_GET_CAP(MAX_MR_SIZE, cap0);
368d55e6fb4SCheng Xu 	dev->attrs.max_mw = 1 << ERDMA_GET_CAP(MAX_MW, cap1);
369d55e6fb4SCheng Xu 	dev->attrs.max_recv_wr = 1 << ERDMA_GET_CAP(MAX_RECV_WR, cap0);
370d55e6fb4SCheng Xu 	dev->attrs.local_dma_key = ERDMA_GET_CAP(DMA_LOCAL_KEY, cap1);
371d55e6fb4SCheng Xu 	dev->attrs.cc = ERDMA_GET_CAP(DEFAULT_CC, cap1);
372d55e6fb4SCheng Xu 	dev->attrs.max_qp = ERDMA_NQP_PER_QBLOCK * ERDMA_GET_CAP(QBLOCK, cap1);
373d55e6fb4SCheng Xu 	dev->attrs.max_mr = dev->attrs.max_qp << 1;
374d55e6fb4SCheng Xu 	dev->attrs.max_cq = dev->attrs.max_qp << 1;
375d55e6fb4SCheng Xu 	dev->attrs.cap_flags = ERDMA_GET_CAP(FLAGS, cap0);
376d55e6fb4SCheng Xu 
377d55e6fb4SCheng Xu 	dev->attrs.max_send_wr = ERDMA_MAX_SEND_WR;
378d55e6fb4SCheng Xu 	dev->attrs.max_ord = ERDMA_MAX_ORD;
379d55e6fb4SCheng Xu 	dev->attrs.max_ird = ERDMA_MAX_IRD;
380d55e6fb4SCheng Xu 	dev->attrs.max_send_sge = ERDMA_MAX_SEND_SGE;
381d55e6fb4SCheng Xu 	dev->attrs.max_recv_sge = ERDMA_MAX_RECV_SGE;
382d55e6fb4SCheng Xu 	dev->attrs.max_sge_rd = ERDMA_MAX_SGE_RD;
383d55e6fb4SCheng Xu 	dev->attrs.max_pd = ERDMA_MAX_PD;
384d55e6fb4SCheng Xu 
385d55e6fb4SCheng Xu 	dev->res_cb[ERDMA_RES_TYPE_PD].max_cap = ERDMA_MAX_PD;
386d55e6fb4SCheng Xu 	dev->res_cb[ERDMA_RES_TYPE_STAG_IDX].max_cap = dev->attrs.max_mr;
387d55e6fb4SCheng Xu 
388d55e6fb4SCheng Xu 	erdma_cmdq_build_reqhdr(&req_hdr, CMDQ_SUBMOD_COMMON,
389d55e6fb4SCheng Xu 				CMDQ_OPCODE_QUERY_FW_INFO);
390d55e6fb4SCheng Xu 
391d55e6fb4SCheng Xu 	err = erdma_post_cmd_wait(&dev->cmdq, &req_hdr, sizeof(req_hdr), &cap0,
392d55e6fb4SCheng Xu 				  &cap1);
393d55e6fb4SCheng Xu 	if (!err)
394d55e6fb4SCheng Xu 		dev->attrs.fw_version =
395d55e6fb4SCheng Xu 			FIELD_GET(ERDMA_CMD_INFO0_FW_VER_MASK, cap0);
396d55e6fb4SCheng Xu 
397d55e6fb4SCheng Xu 	return err;
398d55e6fb4SCheng Xu }
399d55e6fb4SCheng Xu 
erdma_device_config(struct erdma_dev * dev)400d55e6fb4SCheng Xu static int erdma_device_config(struct erdma_dev *dev)
401d55e6fb4SCheng Xu {
402d55e6fb4SCheng Xu 	struct erdma_cmdq_config_device_req req = {};
403d55e6fb4SCheng Xu 
40471c6925fSCheng Xu 	if (!(dev->attrs.cap_flags & ERDMA_DEV_CAP_FLAGS_EXTEND_DB))
405d55e6fb4SCheng Xu 		return 0;
406d55e6fb4SCheng Xu 
407d55e6fb4SCheng Xu 	erdma_cmdq_build_reqhdr(&req.hdr, CMDQ_SUBMOD_COMMON,
408d55e6fb4SCheng Xu 				CMDQ_OPCODE_CONF_DEVICE);
409d55e6fb4SCheng Xu 
410d55e6fb4SCheng Xu 	req.cfg = FIELD_PREP(ERDMA_CMD_CONFIG_DEVICE_PGSHIFT_MASK, PAGE_SHIFT) |
411d55e6fb4SCheng Xu 		  FIELD_PREP(ERDMA_CMD_CONFIG_DEVICE_PS_EN_MASK, 1);
412d55e6fb4SCheng Xu 
413d55e6fb4SCheng Xu 	return erdma_post_cmd_wait(&dev->cmdq, &req, sizeof(req), NULL, NULL);
414d55e6fb4SCheng Xu }
415d55e6fb4SCheng Xu 
erdma_res_cb_init(struct erdma_dev * dev)416d55e6fb4SCheng Xu static int erdma_res_cb_init(struct erdma_dev *dev)
417d55e6fb4SCheng Xu {
418d55e6fb4SCheng Xu 	int i, j;
419d55e6fb4SCheng Xu 
420d55e6fb4SCheng Xu 	for (i = 0; i < ERDMA_RES_CNT; i++) {
421d55e6fb4SCheng Xu 		dev->res_cb[i].next_alloc_idx = 1;
422d55e6fb4SCheng Xu 		spin_lock_init(&dev->res_cb[i].lock);
423d55e6fb4SCheng Xu 		dev->res_cb[i].bitmap =
424d55e6fb4SCheng Xu 			bitmap_zalloc(dev->res_cb[i].max_cap, GFP_KERNEL);
425d55e6fb4SCheng Xu 		if (!dev->res_cb[i].bitmap)
426d55e6fb4SCheng Xu 			goto err;
427d55e6fb4SCheng Xu 	}
428d55e6fb4SCheng Xu 
429d55e6fb4SCheng Xu 	return 0;
430d55e6fb4SCheng Xu 
431d55e6fb4SCheng Xu err:
432d55e6fb4SCheng Xu 	for (j = 0; j < i; j++)
433d55e6fb4SCheng Xu 		bitmap_free(dev->res_cb[j].bitmap);
434d55e6fb4SCheng Xu 
435d55e6fb4SCheng Xu 	return -ENOMEM;
436d55e6fb4SCheng Xu }
437d55e6fb4SCheng Xu 
erdma_res_cb_free(struct erdma_dev * dev)438d55e6fb4SCheng Xu static void erdma_res_cb_free(struct erdma_dev *dev)
439d55e6fb4SCheng Xu {
440d55e6fb4SCheng Xu 	int i;
441d55e6fb4SCheng Xu 
442d55e6fb4SCheng Xu 	for (i = 0; i < ERDMA_RES_CNT; i++)
443d55e6fb4SCheng Xu 		bitmap_free(dev->res_cb[i].bitmap);
444d55e6fb4SCheng Xu }
445d55e6fb4SCheng Xu 
446d55e6fb4SCheng Xu static const struct ib_device_ops erdma_device_ops = {
447d55e6fb4SCheng Xu 	.owner = THIS_MODULE,
448d55e6fb4SCheng Xu 	.driver_id = RDMA_DRIVER_ERDMA,
449d55e6fb4SCheng Xu 	.uverbs_abi_ver = ERDMA_ABI_VERSION,
450d55e6fb4SCheng Xu 
451d55e6fb4SCheng Xu 	.alloc_mr = erdma_ib_alloc_mr,
452d55e6fb4SCheng Xu 	.alloc_pd = erdma_alloc_pd,
453d55e6fb4SCheng Xu 	.alloc_ucontext = erdma_alloc_ucontext,
454d55e6fb4SCheng Xu 	.create_cq = erdma_create_cq,
455d55e6fb4SCheng Xu 	.create_qp = erdma_create_qp,
456d55e6fb4SCheng Xu 	.dealloc_pd = erdma_dealloc_pd,
457d55e6fb4SCheng Xu 	.dealloc_ucontext = erdma_dealloc_ucontext,
458d55e6fb4SCheng Xu 	.dereg_mr = erdma_dereg_mr,
459d55e6fb4SCheng Xu 	.destroy_cq = erdma_destroy_cq,
460d55e6fb4SCheng Xu 	.destroy_qp = erdma_destroy_qp,
461d55e6fb4SCheng Xu 	.get_dma_mr = erdma_get_dma_mr,
462d55e6fb4SCheng Xu 	.get_port_immutable = erdma_get_port_immutable,
463d55e6fb4SCheng Xu 	.iw_accept = erdma_accept,
464d55e6fb4SCheng Xu 	.iw_add_ref = erdma_qp_get_ref,
465d55e6fb4SCheng Xu 	.iw_connect = erdma_connect,
466d55e6fb4SCheng Xu 	.iw_create_listen = erdma_create_listen,
467d55e6fb4SCheng Xu 	.iw_destroy_listen = erdma_destroy_listen,
468d55e6fb4SCheng Xu 	.iw_get_qp = erdma_get_ibqp,
469d55e6fb4SCheng Xu 	.iw_reject = erdma_reject,
470d55e6fb4SCheng Xu 	.iw_rem_ref = erdma_qp_put_ref,
471d55e6fb4SCheng Xu 	.map_mr_sg = erdma_map_mr_sg,
472d55e6fb4SCheng Xu 	.mmap = erdma_mmap,
473d55e6fb4SCheng Xu 	.mmap_free = erdma_mmap_free,
474d55e6fb4SCheng Xu 	.modify_qp = erdma_modify_qp,
475d55e6fb4SCheng Xu 	.post_recv = erdma_post_recv,
476d55e6fb4SCheng Xu 	.post_send = erdma_post_send,
477d55e6fb4SCheng Xu 	.poll_cq = erdma_poll_cq,
478d55e6fb4SCheng Xu 	.query_device = erdma_query_device,
479d55e6fb4SCheng Xu 	.query_gid = erdma_query_gid,
480d55e6fb4SCheng Xu 	.query_port = erdma_query_port,
481d55e6fb4SCheng Xu 	.query_qp = erdma_query_qp,
482d55e6fb4SCheng Xu 	.req_notify_cq = erdma_req_notify_cq,
483d55e6fb4SCheng Xu 	.reg_user_mr = erdma_reg_user_mr,
484d55e6fb4SCheng Xu 
485d55e6fb4SCheng Xu 	INIT_RDMA_OBJ_SIZE(ib_cq, erdma_cq, ibcq),
486d55e6fb4SCheng Xu 	INIT_RDMA_OBJ_SIZE(ib_pd, erdma_pd, ibpd),
487d55e6fb4SCheng Xu 	INIT_RDMA_OBJ_SIZE(ib_ucontext, erdma_ucontext, ibucontext),
488d55e6fb4SCheng Xu 	INIT_RDMA_OBJ_SIZE(ib_qp, erdma_qp, ibqp),
489d55e6fb4SCheng Xu };
490d55e6fb4SCheng Xu 
erdma_ib_device_add(struct pci_dev * pdev)491d55e6fb4SCheng Xu static int erdma_ib_device_add(struct pci_dev *pdev)
492d55e6fb4SCheng Xu {
493d55e6fb4SCheng Xu 	struct erdma_dev *dev = pci_get_drvdata(pdev);
494d55e6fb4SCheng Xu 	struct ib_device *ibdev = &dev->ibdev;
495d55e6fb4SCheng Xu 	u64 mac;
496d55e6fb4SCheng Xu 	int ret;
497d55e6fb4SCheng Xu 
498d55e6fb4SCheng Xu 	ret = erdma_dev_attrs_init(dev);
499d55e6fb4SCheng Xu 	if (ret)
500d55e6fb4SCheng Xu 		return ret;
501d55e6fb4SCheng Xu 
502d55e6fb4SCheng Xu 	ret = erdma_device_config(dev);
503d55e6fb4SCheng Xu 	if (ret)
504d55e6fb4SCheng Xu 		return ret;
505d55e6fb4SCheng Xu 
506d55e6fb4SCheng Xu 	ibdev->node_type = RDMA_NODE_RNIC;
507d55e6fb4SCheng Xu 	memcpy(ibdev->node_desc, ERDMA_NODE_DESC, sizeof(ERDMA_NODE_DESC));
508d55e6fb4SCheng Xu 
509d55e6fb4SCheng Xu 	/*
510d55e6fb4SCheng Xu 	 * Current model (one-to-one device association):
511d55e6fb4SCheng Xu 	 * One ERDMA device per net_device or, equivalently,
512d55e6fb4SCheng Xu 	 * per physical port.
513d55e6fb4SCheng Xu 	 */
514d55e6fb4SCheng Xu 	ibdev->phys_port_cnt = 1;
515d55e6fb4SCheng Xu 	ibdev->num_comp_vectors = dev->attrs.irq_num - 1;
516d55e6fb4SCheng Xu 
517d55e6fb4SCheng Xu 	ib_set_device_ops(ibdev, &erdma_device_ops);
518d55e6fb4SCheng Xu 
519d55e6fb4SCheng Xu 	INIT_LIST_HEAD(&dev->cep_list);
520d55e6fb4SCheng Xu 
521d55e6fb4SCheng Xu 	spin_lock_init(&dev->lock);
522d55e6fb4SCheng Xu 	xa_init_flags(&dev->qp_xa, XA_FLAGS_ALLOC1);
523d55e6fb4SCheng Xu 	xa_init_flags(&dev->cq_xa, XA_FLAGS_ALLOC1);
524d55e6fb4SCheng Xu 	dev->next_alloc_cqn = 1;
525d55e6fb4SCheng Xu 	dev->next_alloc_qpn = 1;
526d55e6fb4SCheng Xu 
527d55e6fb4SCheng Xu 	ret = erdma_res_cb_init(dev);
528d55e6fb4SCheng Xu 	if (ret)
529d55e6fb4SCheng Xu 		return ret;
530d55e6fb4SCheng Xu 
531d55e6fb4SCheng Xu 	atomic_set(&dev->num_ctx, 0);
532d55e6fb4SCheng Xu 
533d55e6fb4SCheng Xu 	mac = erdma_reg_read32(dev, ERDMA_REGS_NETDEV_MAC_L_REG);
534d55e6fb4SCheng Xu 	mac |= (u64)erdma_reg_read32(dev, ERDMA_REGS_NETDEV_MAC_H_REG) << 32;
535d55e6fb4SCheng Xu 
536d55e6fb4SCheng Xu 	u64_to_ether_addr(mac, dev->attrs.peer_addr);
537d55e6fb4SCheng Xu 
538d55e6fb4SCheng Xu 	dev->reflush_wq = alloc_workqueue("erdma-reflush-wq", WQ_UNBOUND,
539d55e6fb4SCheng Xu 					  WQ_UNBOUND_MAX_ACTIVE);
540d55e6fb4SCheng Xu 	if (!dev->reflush_wq) {
541d55e6fb4SCheng Xu 		ret = -ENOMEM;
542d55e6fb4SCheng Xu 		goto err_alloc_workqueue;
543d55e6fb4SCheng Xu 	}
544d55e6fb4SCheng Xu 
545d55e6fb4SCheng Xu 	ret = erdma_device_register(dev);
546d55e6fb4SCheng Xu 	if (ret)
547d55e6fb4SCheng Xu 		goto err_register;
548d55e6fb4SCheng Xu 
549d55e6fb4SCheng Xu 	return 0;
550d55e6fb4SCheng Xu 
55135765dccSCheng Xu err_register:
55235765dccSCheng Xu 	destroy_workqueue(dev->reflush_wq);
55335765dccSCheng Xu err_alloc_workqueue:
55435765dccSCheng Xu 	xa_destroy(&dev->qp_xa);
55535765dccSCheng Xu 	xa_destroy(&dev->cq_xa);
55635765dccSCheng Xu 
55735765dccSCheng Xu 	erdma_res_cb_free(dev);
558d55e6fb4SCheng Xu 
559d55e6fb4SCheng Xu 	return ret;
56035765dccSCheng Xu }
561d55e6fb4SCheng Xu 
erdma_ib_device_remove(struct pci_dev * pdev)562d55e6fb4SCheng Xu static void erdma_ib_device_remove(struct pci_dev *pdev)
563d55e6fb4SCheng Xu {
56435765dccSCheng Xu 	struct erdma_dev *dev = pci_get_drvdata(pdev);
56535765dccSCheng Xu 
56635765dccSCheng Xu 	unregister_netdevice_notifier(&dev->netdev_nb);
567d55e6fb4SCheng Xu 	ib_unregister_device(&dev->ibdev);
568d55e6fb4SCheng Xu 
569d55e6fb4SCheng Xu 	destroy_workqueue(dev->reflush_wq);
570d55e6fb4SCheng Xu 	erdma_res_cb_free(dev);
571d55e6fb4SCheng Xu 	xa_destroy(&dev->qp_xa);
572d55e6fb4SCheng Xu 	xa_destroy(&dev->cq_xa);
573d55e6fb4SCheng Xu }
574d55e6fb4SCheng Xu 
erdma_probe(struct pci_dev * pdev,const struct pci_device_id * ent)575d55e6fb4SCheng Xu static int erdma_probe(struct pci_dev *pdev, const struct pci_device_id *ent)
576d55e6fb4SCheng Xu {
577d55e6fb4SCheng Xu 	int ret;
578d55e6fb4SCheng Xu 
579d55e6fb4SCheng Xu 	ret = erdma_probe_dev(pdev);
580d55e6fb4SCheng Xu 	if (ret)
581d55e6fb4SCheng Xu 		return ret;
58235765dccSCheng Xu 
583d55e6fb4SCheng Xu 	ret = erdma_ib_device_add(pdev);
584d55e6fb4SCheng Xu 	if (ret) {
585d55e6fb4SCheng Xu 		erdma_remove_dev(pdev);
586d55e6fb4SCheng Xu 		return ret;
587d55e6fb4SCheng Xu 	}
588d55e6fb4SCheng Xu 
589d55e6fb4SCheng Xu 	return 0;
590d55e6fb4SCheng Xu }
591d55e6fb4SCheng Xu 
erdma_remove(struct pci_dev * pdev)592d55e6fb4SCheng Xu static void erdma_remove(struct pci_dev *pdev)
593d55e6fb4SCheng Xu {
594d55e6fb4SCheng Xu 	erdma_ib_device_remove(pdev);
595d55e6fb4SCheng Xu 	erdma_remove_dev(pdev);
596d55e6fb4SCheng Xu }
597d55e6fb4SCheng Xu 
598d55e6fb4SCheng Xu static struct pci_driver erdma_pci_driver = {
599d55e6fb4SCheng Xu 	.name = DRV_MODULE_NAME,
600d55e6fb4SCheng Xu 	.id_table = erdma_pci_tbl,
601d55e6fb4SCheng Xu 	.probe = erdma_probe,
602d55e6fb4SCheng Xu 	.remove = erdma_remove
603d55e6fb4SCheng Xu };
604d55e6fb4SCheng Xu 
605d55e6fb4SCheng Xu MODULE_DEVICE_TABLE(pci, erdma_pci_tbl);
606d55e6fb4SCheng Xu 
erdma_init_module(void)607d55e6fb4SCheng Xu static __init int erdma_init_module(void)
608d55e6fb4SCheng Xu {
609d55e6fb4SCheng Xu 	int ret;
610d55e6fb4SCheng Xu 
611d55e6fb4SCheng Xu 	ret = erdma_cm_init();
612d55e6fb4SCheng Xu 	if (ret)
613d55e6fb4SCheng Xu 		return ret;
614d55e6fb4SCheng Xu 
615d55e6fb4SCheng Xu 	ret = pci_register_driver(&erdma_pci_driver);
616d55e6fb4SCheng Xu 	if (ret)
617d55e6fb4SCheng Xu 		erdma_cm_exit();
618d55e6fb4SCheng Xu 
619d55e6fb4SCheng Xu 	return ret;
620d55e6fb4SCheng Xu }
621d55e6fb4SCheng Xu 
erdma_exit_module(void)622d55e6fb4SCheng Xu static void __exit erdma_exit_module(void)
623d55e6fb4SCheng Xu {
624d55e6fb4SCheng Xu 	pci_unregister_driver(&erdma_pci_driver);
625d55e6fb4SCheng Xu 
626d55e6fb4SCheng Xu 	erdma_cm_exit();
627d55e6fb4SCheng Xu }
628d55e6fb4SCheng Xu 
629d55e6fb4SCheng Xu module_init(erdma_init_module);
630d55e6fb4SCheng Xu module_exit(erdma_exit_module);
631d55e6fb4SCheng Xu