xref: /openbmc/linux/net/core/pktgen.c (revision 92b19ff5)
1 /*
2  * Authors:
3  * Copyright 2001, 2002 by Robert Olsson <robert.olsson@its.uu.se>
4  *                             Uppsala University and
5  *                             Swedish University of Agricultural Sciences
6  *
7  * Alexey Kuznetsov  <kuznet@ms2.inr.ac.ru>
8  * Ben Greear <greearb@candelatech.com>
9  * Jens Låås <jens.laas@data.slu.se>
10  *
11  * This program is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU General Public License
13  * as published by the Free Software Foundation; either version
14  * 2 of the License, or (at your option) any later version.
15  *
16  *
17  * A tool for loading the network with preconfigurated packets.
18  * The tool is implemented as a linux module.  Parameters are output
19  * device, delay (to hard_xmit), number of packets, and whether
20  * to use multiple SKBs or just the same one.
21  * pktgen uses the installed interface's output routine.
22  *
23  * Additional hacking by:
24  *
25  * Jens.Laas@data.slu.se
26  * Improved by ANK. 010120.
27  * Improved by ANK even more. 010212.
28  * MAC address typo fixed. 010417 --ro
29  * Integrated.  020301 --DaveM
30  * Added multiskb option 020301 --DaveM
31  * Scaling of results. 020417--sigurdur@linpro.no
32  * Significant re-work of the module:
33  *   *  Convert to threaded model to more efficiently be able to transmit
34  *       and receive on multiple interfaces at once.
35  *   *  Converted many counters to __u64 to allow longer runs.
36  *   *  Allow configuration of ranges, like min/max IP address, MACs,
37  *       and UDP-ports, for both source and destination, and can
38  *       set to use a random distribution or sequentially walk the range.
39  *   *  Can now change most values after starting.
40  *   *  Place 12-byte packet in UDP payload with magic number,
41  *       sequence number, and timestamp.
42  *   *  Add receiver code that detects dropped pkts, re-ordered pkts, and
43  *       latencies (with micro-second) precision.
44  *   *  Add IOCTL interface to easily get counters & configuration.
45  *   --Ben Greear <greearb@candelatech.com>
46  *
47  * Renamed multiskb to clone_skb and cleaned up sending core for two distinct
48  * skb modes. A clone_skb=0 mode for Ben "ranges" work and a clone_skb != 0
49  * as a "fastpath" with a configurable number of clones after alloc's.
50  * clone_skb=0 means all packets are allocated this also means ranges time
51  * stamps etc can be used. clone_skb=100 means 1 malloc is followed by 100
52  * clones.
53  *
54  * Also moved to /proc/net/pktgen/
55  * --ro
56  *
57  * Sept 10:  Fixed threading/locking.  Lots of bone-headed and more clever
58  *    mistakes.  Also merged in DaveM's patch in the -pre6 patch.
59  * --Ben Greear <greearb@candelatech.com>
60  *
61  * Integrated to 2.5.x 021029 --Lucio Maciel (luciomaciel@zipmail.com.br)
62  *
63  *
64  * 021124 Finished major redesign and rewrite for new functionality.
65  * See Documentation/networking/pktgen.txt for how to use this.
66  *
67  * The new operation:
68  * For each CPU one thread/process is created at start. This process checks
69  * for running devices in the if_list and sends packets until count is 0 it
70  * also the thread checks the thread->control which is used for inter-process
71  * communication. controlling process "posts" operations to the threads this
72  * way.
73  * The if_list is RCU protected, and the if_lock remains to protect updating
74  * of if_list, from "add_device" as it invoked from userspace (via proc write).
75  *
76  * By design there should only be *one* "controlling" process. In practice
77  * multiple write accesses gives unpredictable result. Understood by "write"
78  * to /proc gives result code thats should be read be the "writer".
79  * For practical use this should be no problem.
80  *
81  * Note when adding devices to a specific CPU there good idea to also assign
82  * /proc/irq/XX/smp_affinity so TX-interrupts gets bound to the same CPU.
83  * --ro
84  *
85  * Fix refcount off by one if first packet fails, potential null deref,
86  * memleak 030710- KJP
87  *
88  * First "ranges" functionality for ipv6 030726 --ro
89  *
90  * Included flow support. 030802 ANK.
91  *
92  * Fixed unaligned access on IA-64 Grant Grundler <grundler@parisc-linux.org>
93  *
94  * Remove if fix from added Harald Welte <laforge@netfilter.org> 040419
95  * ia64 compilation fix from  Aron Griffis <aron@hp.com> 040604
96  *
97  * New xmit() return, do_div and misc clean up by Stephen Hemminger
98  * <shemminger@osdl.org> 040923
99  *
100  * Randy Dunlap fixed u64 printk compiler warning
101  *
102  * Remove FCS from BW calculation.  Lennert Buytenhek <buytenh@wantstofly.org>
103  * New time handling. Lennert Buytenhek <buytenh@wantstofly.org> 041213
104  *
105  * Corrections from Nikolai Malykh (nmalykh@bilim.com)
106  * Removed unused flags F_SET_SRCMAC & F_SET_SRCIP 041230
107  *
108  * interruptible_sleep_on_timeout() replaced Nishanth Aravamudan <nacc@us.ibm.com>
109  * 050103
110  *
111  * MPLS support by Steven Whitehouse <steve@chygwyn.com>
112  *
113  * 802.1Q/Q-in-Q support by Francesco Fondelli (FF) <francesco.fondelli@gmail.com>
114  *
115  * Fixed src_mac command to set source mac of packet to value specified in
116  * command by Adit Ranadive <adit.262@gmail.com>
117  *
118  */
119 
120 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
121 
122 #include <linux/sys.h>
123 #include <linux/types.h>
124 #include <linux/module.h>
125 #include <linux/moduleparam.h>
126 #include <linux/kernel.h>
127 #include <linux/mutex.h>
128 #include <linux/sched.h>
129 #include <linux/slab.h>
130 #include <linux/vmalloc.h>
131 #include <linux/unistd.h>
132 #include <linux/string.h>
133 #include <linux/ptrace.h>
134 #include <linux/errno.h>
135 #include <linux/ioport.h>
136 #include <linux/interrupt.h>
137 #include <linux/capability.h>
138 #include <linux/hrtimer.h>
139 #include <linux/freezer.h>
140 #include <linux/delay.h>
141 #include <linux/timer.h>
142 #include <linux/list.h>
143 #include <linux/init.h>
144 #include <linux/skbuff.h>
145 #include <linux/netdevice.h>
146 #include <linux/inet.h>
147 #include <linux/inetdevice.h>
148 #include <linux/rtnetlink.h>
149 #include <linux/if_arp.h>
150 #include <linux/if_vlan.h>
151 #include <linux/in.h>
152 #include <linux/ip.h>
153 #include <linux/ipv6.h>
154 #include <linux/udp.h>
155 #include <linux/proc_fs.h>
156 #include <linux/seq_file.h>
157 #include <linux/wait.h>
158 #include <linux/etherdevice.h>
159 #include <linux/kthread.h>
160 #include <linux/prefetch.h>
161 #include <net/net_namespace.h>
162 #include <net/checksum.h>
163 #include <net/ipv6.h>
164 #include <net/udp.h>
165 #include <net/ip6_checksum.h>
166 #include <net/addrconf.h>
167 #ifdef CONFIG_XFRM
168 #include <net/xfrm.h>
169 #endif
170 #include <net/netns/generic.h>
171 #include <asm/byteorder.h>
172 #include <linux/rcupdate.h>
173 #include <linux/bitops.h>
174 #include <linux/io.h>
175 #include <linux/timex.h>
176 #include <linux/uaccess.h>
177 #include <asm/dma.h>
178 #include <asm/div64.h>		/* do_div */
179 
180 #define VERSION	"2.75"
181 #define IP_NAME_SZ 32
182 #define MAX_MPLS_LABELS 16 /* This is the max label stack depth */
183 #define MPLS_STACK_BOTTOM htonl(0x00000100)
184 
185 #define func_enter() pr_debug("entering %s\n", __func__);
186 
187 /* Device flag bits */
188 #define F_IPSRC_RND   (1<<0)	/* IP-Src Random  */
189 #define F_IPDST_RND   (1<<1)	/* IP-Dst Random  */
190 #define F_UDPSRC_RND  (1<<2)	/* UDP-Src Random */
191 #define F_UDPDST_RND  (1<<3)	/* UDP-Dst Random */
192 #define F_MACSRC_RND  (1<<4)	/* MAC-Src Random */
193 #define F_MACDST_RND  (1<<5)	/* MAC-Dst Random */
194 #define F_TXSIZE_RND  (1<<6)	/* Transmit size is random */
195 #define F_IPV6        (1<<7)	/* Interface in IPV6 Mode */
196 #define F_MPLS_RND    (1<<8)	/* Random MPLS labels */
197 #define F_VID_RND     (1<<9)	/* Random VLAN ID */
198 #define F_SVID_RND    (1<<10)	/* Random SVLAN ID */
199 #define F_FLOW_SEQ    (1<<11)	/* Sequential flows */
200 #define F_IPSEC_ON    (1<<12)	/* ipsec on for flows */
201 #define F_QUEUE_MAP_RND (1<<13)	/* queue map Random */
202 #define F_QUEUE_MAP_CPU (1<<14)	/* queue map mirrors smp_processor_id() */
203 #define F_NODE          (1<<15)	/* Node memory alloc*/
204 #define F_UDPCSUM       (1<<16)	/* Include UDP checksum */
205 #define F_NO_TIMESTAMP  (1<<17)	/* Don't timestamp packets (default TS) */
206 
207 /* Thread control flag bits */
208 #define T_STOP        (1<<0)	/* Stop run */
209 #define T_RUN         (1<<1)	/* Start run */
210 #define T_REMDEVALL   (1<<2)	/* Remove all devs */
211 #define T_REMDEV      (1<<3)	/* Remove one dev */
212 
213 /* Xmit modes */
214 #define M_START_XMIT		0	/* Default normal TX */
215 #define M_NETIF_RECEIVE 	1	/* Inject packets into stack */
216 
217 /* If lock -- protects updating of if_list */
218 #define   if_lock(t)           spin_lock(&(t->if_lock));
219 #define   if_unlock(t)           spin_unlock(&(t->if_lock));
220 
221 /* Used to help with determining the pkts on receive */
222 #define PKTGEN_MAGIC 0xbe9be955
223 #define PG_PROC_DIR "pktgen"
224 #define PGCTRL	    "pgctrl"
225 
226 #define MAX_CFLOWS  65536
227 
228 #define VLAN_TAG_SIZE(x) ((x)->vlan_id == 0xffff ? 0 : 4)
229 #define SVLAN_TAG_SIZE(x) ((x)->svlan_id == 0xffff ? 0 : 4)
230 
231 struct flow_state {
232 	__be32 cur_daddr;
233 	int count;
234 #ifdef CONFIG_XFRM
235 	struct xfrm_state *x;
236 #endif
237 	__u32 flags;
238 };
239 
240 /* flow flag bits */
241 #define F_INIT   (1<<0)		/* flow has been initialized */
242 
243 struct pktgen_dev {
244 	/*
245 	 * Try to keep frequent/infrequent used vars. separated.
246 	 */
247 	struct proc_dir_entry *entry;	/* proc file */
248 	struct pktgen_thread *pg_thread;/* the owner */
249 	struct list_head list;		/* chaining in the thread's run-queue */
250 	struct rcu_head	 rcu;		/* freed by RCU */
251 
252 	int running;		/* if false, the test will stop */
253 
254 	/* If min != max, then we will either do a linear iteration, or
255 	 * we will do a random selection from within the range.
256 	 */
257 	__u32 flags;
258 	int xmit_mode;
259 	int min_pkt_size;
260 	int max_pkt_size;
261 	int pkt_overhead;	/* overhead for MPLS, VLANs, IPSEC etc */
262 	int nfrags;
263 	int removal_mark;	/* non-zero => the device is marked for
264 				 * removal by worker thread */
265 
266 	struct page *page;
267 	u64 delay;		/* nano-seconds */
268 
269 	__u64 count;		/* Default No packets to send */
270 	__u64 sofar;		/* How many pkts we've sent so far */
271 	__u64 tx_bytes;		/* How many bytes we've transmitted */
272 	__u64 errors;		/* Errors when trying to transmit, */
273 
274 	/* runtime counters relating to clone_skb */
275 
276 	__u64 allocated_skbs;
277 	__u32 clone_count;
278 	int last_ok;		/* Was last skb sent?
279 				 * Or a failed transmit of some sort?
280 				 * This will keep sequence numbers in order
281 				 */
282 	ktime_t next_tx;
283 	ktime_t started_at;
284 	ktime_t stopped_at;
285 	u64	idle_acc;	/* nano-seconds */
286 
287 	__u32 seq_num;
288 
289 	int clone_skb;		/*
290 				 * Use multiple SKBs during packet gen.
291 				 * If this number is greater than 1, then
292 				 * that many copies of the same packet will be
293 				 * sent before a new packet is allocated.
294 				 * If you want to send 1024 identical packets
295 				 * before creating a new packet,
296 				 * set clone_skb to 1024.
297 				 */
298 
299 	char dst_min[IP_NAME_SZ];	/* IP, ie 1.2.3.4 */
300 	char dst_max[IP_NAME_SZ];	/* IP, ie 1.2.3.4 */
301 	char src_min[IP_NAME_SZ];	/* IP, ie 1.2.3.4 */
302 	char src_max[IP_NAME_SZ];	/* IP, ie 1.2.3.4 */
303 
304 	struct in6_addr in6_saddr;
305 	struct in6_addr in6_daddr;
306 	struct in6_addr cur_in6_daddr;
307 	struct in6_addr cur_in6_saddr;
308 	/* For ranges */
309 	struct in6_addr min_in6_daddr;
310 	struct in6_addr max_in6_daddr;
311 	struct in6_addr min_in6_saddr;
312 	struct in6_addr max_in6_saddr;
313 
314 	/* If we're doing ranges, random or incremental, then this
315 	 * defines the min/max for those ranges.
316 	 */
317 	__be32 saddr_min;	/* inclusive, source IP address */
318 	__be32 saddr_max;	/* exclusive, source IP address */
319 	__be32 daddr_min;	/* inclusive, dest IP address */
320 	__be32 daddr_max;	/* exclusive, dest IP address */
321 
322 	__u16 udp_src_min;	/* inclusive, source UDP port */
323 	__u16 udp_src_max;	/* exclusive, source UDP port */
324 	__u16 udp_dst_min;	/* inclusive, dest UDP port */
325 	__u16 udp_dst_max;	/* exclusive, dest UDP port */
326 
327 	/* DSCP + ECN */
328 	__u8 tos;            /* six MSB of (former) IPv4 TOS
329 				are for dscp codepoint */
330 	__u8 traffic_class;  /* ditto for the (former) Traffic Class in IPv6
331 				(see RFC 3260, sec. 4) */
332 
333 	/* MPLS */
334 	unsigned int nr_labels;	/* Depth of stack, 0 = no MPLS */
335 	__be32 labels[MAX_MPLS_LABELS];
336 
337 	/* VLAN/SVLAN (802.1Q/Q-in-Q) */
338 	__u8  vlan_p;
339 	__u8  vlan_cfi;
340 	__u16 vlan_id;  /* 0xffff means no vlan tag */
341 
342 	__u8  svlan_p;
343 	__u8  svlan_cfi;
344 	__u16 svlan_id; /* 0xffff means no svlan tag */
345 
346 	__u32 src_mac_count;	/* How many MACs to iterate through */
347 	__u32 dst_mac_count;	/* How many MACs to iterate through */
348 
349 	unsigned char dst_mac[ETH_ALEN];
350 	unsigned char src_mac[ETH_ALEN];
351 
352 	__u32 cur_dst_mac_offset;
353 	__u32 cur_src_mac_offset;
354 	__be32 cur_saddr;
355 	__be32 cur_daddr;
356 	__u16 ip_id;
357 	__u16 cur_udp_dst;
358 	__u16 cur_udp_src;
359 	__u16 cur_queue_map;
360 	__u32 cur_pkt_size;
361 	__u32 last_pkt_size;
362 
363 	__u8 hh[14];
364 	/* = {
365 	   0x00, 0x80, 0xC8, 0x79, 0xB3, 0xCB,
366 
367 	   We fill in SRC address later
368 	   0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
369 	   0x08, 0x00
370 	   };
371 	 */
372 	__u16 pad;		/* pad out the hh struct to an even 16 bytes */
373 
374 	struct sk_buff *skb;	/* skb we are to transmit next, used for when we
375 				 * are transmitting the same one multiple times
376 				 */
377 	struct net_device *odev; /* The out-going device.
378 				  * Note that the device should have it's
379 				  * pg_info pointer pointing back to this
380 				  * device.
381 				  * Set when the user specifies the out-going
382 				  * device name (not when the inject is
383 				  * started as it used to do.)
384 				  */
385 	char odevname[32];
386 	struct flow_state *flows;
387 	unsigned int cflows;	/* Concurrent flows (config) */
388 	unsigned int lflow;		/* Flow length  (config) */
389 	unsigned int nflows;	/* accumulated flows (stats) */
390 	unsigned int curfl;		/* current sequenced flow (state)*/
391 
392 	u16 queue_map_min;
393 	u16 queue_map_max;
394 	__u32 skb_priority;	/* skb priority field */
395 	unsigned int burst;	/* number of duplicated packets to burst */
396 	int node;               /* Memory node */
397 
398 #ifdef CONFIG_XFRM
399 	__u8	ipsmode;		/* IPSEC mode (config) */
400 	__u8	ipsproto;		/* IPSEC type (config) */
401 	__u32	spi;
402 	struct dst_entry dst;
403 	struct dst_ops dstops;
404 #endif
405 	char result[512];
406 };
407 
408 struct pktgen_hdr {
409 	__be32 pgh_magic;
410 	__be32 seq_num;
411 	__be32 tv_sec;
412 	__be32 tv_usec;
413 };
414 
415 
416 static int pg_net_id __read_mostly;
417 
418 struct pktgen_net {
419 	struct net		*net;
420 	struct proc_dir_entry	*proc_dir;
421 	struct list_head	pktgen_threads;
422 	bool			pktgen_exiting;
423 };
424 
425 struct pktgen_thread {
426 	spinlock_t if_lock;		/* for list of devices */
427 	struct list_head if_list;	/* All device here */
428 	struct list_head th_list;
429 	struct task_struct *tsk;
430 	char result[512];
431 
432 	/* Field for thread to receive "posted" events terminate,
433 	   stop ifs etc. */
434 
435 	u32 control;
436 	int cpu;
437 
438 	wait_queue_head_t queue;
439 	struct completion start_done;
440 	struct pktgen_net *net;
441 };
442 
443 #define REMOVE 1
444 #define FIND   0
445 
446 static const char version[] =
447 	"Packet Generator for packet performance testing. "
448 	"Version: " VERSION "\n";
449 
450 static int pktgen_remove_device(struct pktgen_thread *t, struct pktgen_dev *i);
451 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname);
452 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
453 					  const char *ifname, bool exact);
454 static int pktgen_device_event(struct notifier_block *, unsigned long, void *);
455 static void pktgen_run_all_threads(struct pktgen_net *pn);
456 static void pktgen_reset_all_threads(struct pktgen_net *pn);
457 static void pktgen_stop_all_threads_ifs(struct pktgen_net *pn);
458 
459 static void pktgen_stop(struct pktgen_thread *t);
460 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev);
461 
462 /* Module parameters, defaults. */
463 static int pg_count_d __read_mostly = 1000;
464 static int pg_delay_d __read_mostly;
465 static int pg_clone_skb_d  __read_mostly;
466 static int debug  __read_mostly;
467 
468 static DEFINE_MUTEX(pktgen_thread_lock);
469 
470 static struct notifier_block pktgen_notifier_block = {
471 	.notifier_call = pktgen_device_event,
472 };
473 
474 /*
475  * /proc handling functions
476  *
477  */
478 
479 static int pgctrl_show(struct seq_file *seq, void *v)
480 {
481 	seq_puts(seq, version);
482 	return 0;
483 }
484 
485 static ssize_t pgctrl_write(struct file *file, const char __user *buf,
486 			    size_t count, loff_t *ppos)
487 {
488 	char data[128];
489 	struct pktgen_net *pn = net_generic(current->nsproxy->net_ns, pg_net_id);
490 
491 	if (!capable(CAP_NET_ADMIN))
492 		return -EPERM;
493 
494 	if (count == 0)
495 		return -EINVAL;
496 
497 	if (count > sizeof(data))
498 		count = sizeof(data);
499 
500 	if (copy_from_user(data, buf, count))
501 		return -EFAULT;
502 
503 	data[count - 1] = 0;	/* Strip trailing '\n' and terminate string */
504 
505 	if (!strcmp(data, "stop"))
506 		pktgen_stop_all_threads_ifs(pn);
507 
508 	else if (!strcmp(data, "start"))
509 		pktgen_run_all_threads(pn);
510 
511 	else if (!strcmp(data, "reset"))
512 		pktgen_reset_all_threads(pn);
513 
514 	else
515 		return -EINVAL;
516 
517 	return count;
518 }
519 
520 static int pgctrl_open(struct inode *inode, struct file *file)
521 {
522 	return single_open(file, pgctrl_show, PDE_DATA(inode));
523 }
524 
525 static const struct file_operations pktgen_fops = {
526 	.owner   = THIS_MODULE,
527 	.open    = pgctrl_open,
528 	.read    = seq_read,
529 	.llseek  = seq_lseek,
530 	.write   = pgctrl_write,
531 	.release = single_release,
532 };
533 
534 static int pktgen_if_show(struct seq_file *seq, void *v)
535 {
536 	const struct pktgen_dev *pkt_dev = seq->private;
537 	ktime_t stopped;
538 	u64 idle;
539 
540 	seq_printf(seq,
541 		   "Params: count %llu  min_pkt_size: %u  max_pkt_size: %u\n",
542 		   (unsigned long long)pkt_dev->count, pkt_dev->min_pkt_size,
543 		   pkt_dev->max_pkt_size);
544 
545 	seq_printf(seq,
546 		   "     frags: %d  delay: %llu  clone_skb: %d  ifname: %s\n",
547 		   pkt_dev->nfrags, (unsigned long long) pkt_dev->delay,
548 		   pkt_dev->clone_skb, pkt_dev->odevname);
549 
550 	seq_printf(seq, "     flows: %u flowlen: %u\n", pkt_dev->cflows,
551 		   pkt_dev->lflow);
552 
553 	seq_printf(seq,
554 		   "     queue_map_min: %u  queue_map_max: %u\n",
555 		   pkt_dev->queue_map_min,
556 		   pkt_dev->queue_map_max);
557 
558 	if (pkt_dev->skb_priority)
559 		seq_printf(seq, "     skb_priority: %u\n",
560 			   pkt_dev->skb_priority);
561 
562 	if (pkt_dev->flags & F_IPV6) {
563 		seq_printf(seq,
564 			   "     saddr: %pI6c  min_saddr: %pI6c  max_saddr: %pI6c\n"
565 			   "     daddr: %pI6c  min_daddr: %pI6c  max_daddr: %pI6c\n",
566 			   &pkt_dev->in6_saddr,
567 			   &pkt_dev->min_in6_saddr, &pkt_dev->max_in6_saddr,
568 			   &pkt_dev->in6_daddr,
569 			   &pkt_dev->min_in6_daddr, &pkt_dev->max_in6_daddr);
570 	} else {
571 		seq_printf(seq,
572 			   "     dst_min: %s  dst_max: %s\n",
573 			   pkt_dev->dst_min, pkt_dev->dst_max);
574 		seq_printf(seq,
575 			   "     src_min: %s  src_max: %s\n",
576 			   pkt_dev->src_min, pkt_dev->src_max);
577 	}
578 
579 	seq_puts(seq, "     src_mac: ");
580 
581 	seq_printf(seq, "%pM ",
582 		   is_zero_ether_addr(pkt_dev->src_mac) ?
583 			     pkt_dev->odev->dev_addr : pkt_dev->src_mac);
584 
585 	seq_puts(seq, "dst_mac: ");
586 	seq_printf(seq, "%pM\n", pkt_dev->dst_mac);
587 
588 	seq_printf(seq,
589 		   "     udp_src_min: %d  udp_src_max: %d"
590 		   "  udp_dst_min: %d  udp_dst_max: %d\n",
591 		   pkt_dev->udp_src_min, pkt_dev->udp_src_max,
592 		   pkt_dev->udp_dst_min, pkt_dev->udp_dst_max);
593 
594 	seq_printf(seq,
595 		   "     src_mac_count: %d  dst_mac_count: %d\n",
596 		   pkt_dev->src_mac_count, pkt_dev->dst_mac_count);
597 
598 	if (pkt_dev->nr_labels) {
599 		unsigned int i;
600 		seq_puts(seq, "     mpls: ");
601 		for (i = 0; i < pkt_dev->nr_labels; i++)
602 			seq_printf(seq, "%08x%s", ntohl(pkt_dev->labels[i]),
603 				   i == pkt_dev->nr_labels-1 ? "\n" : ", ");
604 	}
605 
606 	if (pkt_dev->vlan_id != 0xffff)
607 		seq_printf(seq, "     vlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
608 			   pkt_dev->vlan_id, pkt_dev->vlan_p,
609 			   pkt_dev->vlan_cfi);
610 
611 	if (pkt_dev->svlan_id != 0xffff)
612 		seq_printf(seq, "     svlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
613 			   pkt_dev->svlan_id, pkt_dev->svlan_p,
614 			   pkt_dev->svlan_cfi);
615 
616 	if (pkt_dev->tos)
617 		seq_printf(seq, "     tos: 0x%02x\n", pkt_dev->tos);
618 
619 	if (pkt_dev->traffic_class)
620 		seq_printf(seq, "     traffic_class: 0x%02x\n", pkt_dev->traffic_class);
621 
622 	if (pkt_dev->burst > 1)
623 		seq_printf(seq, "     burst: %d\n", pkt_dev->burst);
624 
625 	if (pkt_dev->node >= 0)
626 		seq_printf(seq, "     node: %d\n", pkt_dev->node);
627 
628 	if (pkt_dev->xmit_mode == M_NETIF_RECEIVE)
629 		seq_puts(seq, "     xmit_mode: netif_receive\n");
630 
631 	seq_puts(seq, "     Flags: ");
632 
633 	if (pkt_dev->flags & F_IPV6)
634 		seq_puts(seq, "IPV6  ");
635 
636 	if (pkt_dev->flags & F_IPSRC_RND)
637 		seq_puts(seq, "IPSRC_RND  ");
638 
639 	if (pkt_dev->flags & F_IPDST_RND)
640 		seq_puts(seq, "IPDST_RND  ");
641 
642 	if (pkt_dev->flags & F_TXSIZE_RND)
643 		seq_puts(seq, "TXSIZE_RND  ");
644 
645 	if (pkt_dev->flags & F_UDPSRC_RND)
646 		seq_puts(seq, "UDPSRC_RND  ");
647 
648 	if (pkt_dev->flags & F_UDPDST_RND)
649 		seq_puts(seq, "UDPDST_RND  ");
650 
651 	if (pkt_dev->flags & F_UDPCSUM)
652 		seq_puts(seq, "UDPCSUM  ");
653 
654 	if (pkt_dev->flags & F_NO_TIMESTAMP)
655 		seq_puts(seq, "NO_TIMESTAMP  ");
656 
657 	if (pkt_dev->flags & F_MPLS_RND)
658 		seq_puts(seq,  "MPLS_RND  ");
659 
660 	if (pkt_dev->flags & F_QUEUE_MAP_RND)
661 		seq_puts(seq,  "QUEUE_MAP_RND  ");
662 
663 	if (pkt_dev->flags & F_QUEUE_MAP_CPU)
664 		seq_puts(seq,  "QUEUE_MAP_CPU  ");
665 
666 	if (pkt_dev->cflows) {
667 		if (pkt_dev->flags & F_FLOW_SEQ)
668 			seq_puts(seq,  "FLOW_SEQ  "); /*in sequence flows*/
669 		else
670 			seq_puts(seq,  "FLOW_RND  ");
671 	}
672 
673 #ifdef CONFIG_XFRM
674 	if (pkt_dev->flags & F_IPSEC_ON) {
675 		seq_puts(seq,  "IPSEC  ");
676 		if (pkt_dev->spi)
677 			seq_printf(seq, "spi:%u", pkt_dev->spi);
678 	}
679 #endif
680 
681 	if (pkt_dev->flags & F_MACSRC_RND)
682 		seq_puts(seq, "MACSRC_RND  ");
683 
684 	if (pkt_dev->flags & F_MACDST_RND)
685 		seq_puts(seq, "MACDST_RND  ");
686 
687 	if (pkt_dev->flags & F_VID_RND)
688 		seq_puts(seq, "VID_RND  ");
689 
690 	if (pkt_dev->flags & F_SVID_RND)
691 		seq_puts(seq, "SVID_RND  ");
692 
693 	if (pkt_dev->flags & F_NODE)
694 		seq_puts(seq, "NODE_ALLOC  ");
695 
696 	seq_puts(seq, "\n");
697 
698 	/* not really stopped, more like last-running-at */
699 	stopped = pkt_dev->running ? ktime_get() : pkt_dev->stopped_at;
700 	idle = pkt_dev->idle_acc;
701 	do_div(idle, NSEC_PER_USEC);
702 
703 	seq_printf(seq,
704 		   "Current:\n     pkts-sofar: %llu  errors: %llu\n",
705 		   (unsigned long long)pkt_dev->sofar,
706 		   (unsigned long long)pkt_dev->errors);
707 
708 	seq_printf(seq,
709 		   "     started: %lluus  stopped: %lluus idle: %lluus\n",
710 		   (unsigned long long) ktime_to_us(pkt_dev->started_at),
711 		   (unsigned long long) ktime_to_us(stopped),
712 		   (unsigned long long) idle);
713 
714 	seq_printf(seq,
715 		   "     seq_num: %d  cur_dst_mac_offset: %d  cur_src_mac_offset: %d\n",
716 		   pkt_dev->seq_num, pkt_dev->cur_dst_mac_offset,
717 		   pkt_dev->cur_src_mac_offset);
718 
719 	if (pkt_dev->flags & F_IPV6) {
720 		seq_printf(seq, "     cur_saddr: %pI6c  cur_daddr: %pI6c\n",
721 				&pkt_dev->cur_in6_saddr,
722 				&pkt_dev->cur_in6_daddr);
723 	} else
724 		seq_printf(seq, "     cur_saddr: %pI4  cur_daddr: %pI4\n",
725 			   &pkt_dev->cur_saddr, &pkt_dev->cur_daddr);
726 
727 	seq_printf(seq, "     cur_udp_dst: %d  cur_udp_src: %d\n",
728 		   pkt_dev->cur_udp_dst, pkt_dev->cur_udp_src);
729 
730 	seq_printf(seq, "     cur_queue_map: %u\n", pkt_dev->cur_queue_map);
731 
732 	seq_printf(seq, "     flows: %u\n", pkt_dev->nflows);
733 
734 	if (pkt_dev->result[0])
735 		seq_printf(seq, "Result: %s\n", pkt_dev->result);
736 	else
737 		seq_puts(seq, "Result: Idle\n");
738 
739 	return 0;
740 }
741 
742 
743 static int hex32_arg(const char __user *user_buffer, unsigned long maxlen,
744 		     __u32 *num)
745 {
746 	int i = 0;
747 	*num = 0;
748 
749 	for (; i < maxlen; i++) {
750 		int value;
751 		char c;
752 		*num <<= 4;
753 		if (get_user(c, &user_buffer[i]))
754 			return -EFAULT;
755 		value = hex_to_bin(c);
756 		if (value >= 0)
757 			*num |= value;
758 		else
759 			break;
760 	}
761 	return i;
762 }
763 
764 static int count_trail_chars(const char __user * user_buffer,
765 			     unsigned int maxlen)
766 {
767 	int i;
768 
769 	for (i = 0; i < maxlen; i++) {
770 		char c;
771 		if (get_user(c, &user_buffer[i]))
772 			return -EFAULT;
773 		switch (c) {
774 		case '\"':
775 		case '\n':
776 		case '\r':
777 		case '\t':
778 		case ' ':
779 		case '=':
780 			break;
781 		default:
782 			goto done;
783 		}
784 	}
785 done:
786 	return i;
787 }
788 
789 static long num_arg(const char __user *user_buffer, unsigned long maxlen,
790 				unsigned long *num)
791 {
792 	int i;
793 	*num = 0;
794 
795 	for (i = 0; i < maxlen; i++) {
796 		char c;
797 		if (get_user(c, &user_buffer[i]))
798 			return -EFAULT;
799 		if ((c >= '0') && (c <= '9')) {
800 			*num *= 10;
801 			*num += c - '0';
802 		} else
803 			break;
804 	}
805 	return i;
806 }
807 
808 static int strn_len(const char __user * user_buffer, unsigned int maxlen)
809 {
810 	int i;
811 
812 	for (i = 0; i < maxlen; i++) {
813 		char c;
814 		if (get_user(c, &user_buffer[i]))
815 			return -EFAULT;
816 		switch (c) {
817 		case '\"':
818 		case '\n':
819 		case '\r':
820 		case '\t':
821 		case ' ':
822 			goto done_str;
823 		default:
824 			break;
825 		}
826 	}
827 done_str:
828 	return i;
829 }
830 
831 static ssize_t get_labels(const char __user *buffer, struct pktgen_dev *pkt_dev)
832 {
833 	unsigned int n = 0;
834 	char c;
835 	ssize_t i = 0;
836 	int len;
837 
838 	pkt_dev->nr_labels = 0;
839 	do {
840 		__u32 tmp;
841 		len = hex32_arg(&buffer[i], 8, &tmp);
842 		if (len <= 0)
843 			return len;
844 		pkt_dev->labels[n] = htonl(tmp);
845 		if (pkt_dev->labels[n] & MPLS_STACK_BOTTOM)
846 			pkt_dev->flags |= F_MPLS_RND;
847 		i += len;
848 		if (get_user(c, &buffer[i]))
849 			return -EFAULT;
850 		i++;
851 		n++;
852 		if (n >= MAX_MPLS_LABELS)
853 			return -E2BIG;
854 	} while (c == ',');
855 
856 	pkt_dev->nr_labels = n;
857 	return i;
858 }
859 
860 static ssize_t pktgen_if_write(struct file *file,
861 			       const char __user * user_buffer, size_t count,
862 			       loff_t * offset)
863 {
864 	struct seq_file *seq = file->private_data;
865 	struct pktgen_dev *pkt_dev = seq->private;
866 	int i, max, len;
867 	char name[16], valstr[32];
868 	unsigned long value = 0;
869 	char *pg_result = NULL;
870 	int tmp = 0;
871 	char buf[128];
872 
873 	pg_result = &(pkt_dev->result[0]);
874 
875 	if (count < 1) {
876 		pr_warn("wrong command format\n");
877 		return -EINVAL;
878 	}
879 
880 	max = count;
881 	tmp = count_trail_chars(user_buffer, max);
882 	if (tmp < 0) {
883 		pr_warn("illegal format\n");
884 		return tmp;
885 	}
886 	i = tmp;
887 
888 	/* Read variable name */
889 
890 	len = strn_len(&user_buffer[i], sizeof(name) - 1);
891 	if (len < 0)
892 		return len;
893 
894 	memset(name, 0, sizeof(name));
895 	if (copy_from_user(name, &user_buffer[i], len))
896 		return -EFAULT;
897 	i += len;
898 
899 	max = count - i;
900 	len = count_trail_chars(&user_buffer[i], max);
901 	if (len < 0)
902 		return len;
903 
904 	i += len;
905 
906 	if (debug) {
907 		size_t copy = min_t(size_t, count, 1023);
908 		char tb[copy + 1];
909 		if (copy_from_user(tb, user_buffer, copy))
910 			return -EFAULT;
911 		tb[copy] = 0;
912 		pr_debug("%s,%lu  buffer -:%s:-\n",
913 			 name, (unsigned long)count, tb);
914 	}
915 
916 	if (!strcmp(name, "min_pkt_size")) {
917 		len = num_arg(&user_buffer[i], 10, &value);
918 		if (len < 0)
919 			return len;
920 
921 		i += len;
922 		if (value < 14 + 20 + 8)
923 			value = 14 + 20 + 8;
924 		if (value != pkt_dev->min_pkt_size) {
925 			pkt_dev->min_pkt_size = value;
926 			pkt_dev->cur_pkt_size = value;
927 		}
928 		sprintf(pg_result, "OK: min_pkt_size=%u",
929 			pkt_dev->min_pkt_size);
930 		return count;
931 	}
932 
933 	if (!strcmp(name, "max_pkt_size")) {
934 		len = num_arg(&user_buffer[i], 10, &value);
935 		if (len < 0)
936 			return len;
937 
938 		i += len;
939 		if (value < 14 + 20 + 8)
940 			value = 14 + 20 + 8;
941 		if (value != pkt_dev->max_pkt_size) {
942 			pkt_dev->max_pkt_size = value;
943 			pkt_dev->cur_pkt_size = value;
944 		}
945 		sprintf(pg_result, "OK: max_pkt_size=%u",
946 			pkt_dev->max_pkt_size);
947 		return count;
948 	}
949 
950 	/* Shortcut for min = max */
951 
952 	if (!strcmp(name, "pkt_size")) {
953 		len = num_arg(&user_buffer[i], 10, &value);
954 		if (len < 0)
955 			return len;
956 
957 		i += len;
958 		if (value < 14 + 20 + 8)
959 			value = 14 + 20 + 8;
960 		if (value != pkt_dev->min_pkt_size) {
961 			pkt_dev->min_pkt_size = value;
962 			pkt_dev->max_pkt_size = value;
963 			pkt_dev->cur_pkt_size = value;
964 		}
965 		sprintf(pg_result, "OK: pkt_size=%u", pkt_dev->min_pkt_size);
966 		return count;
967 	}
968 
969 	if (!strcmp(name, "debug")) {
970 		len = num_arg(&user_buffer[i], 10, &value);
971 		if (len < 0)
972 			return len;
973 
974 		i += len;
975 		debug = value;
976 		sprintf(pg_result, "OK: debug=%u", debug);
977 		return count;
978 	}
979 
980 	if (!strcmp(name, "frags")) {
981 		len = num_arg(&user_buffer[i], 10, &value);
982 		if (len < 0)
983 			return len;
984 
985 		i += len;
986 		pkt_dev->nfrags = value;
987 		sprintf(pg_result, "OK: frags=%u", pkt_dev->nfrags);
988 		return count;
989 	}
990 	if (!strcmp(name, "delay")) {
991 		len = num_arg(&user_buffer[i], 10, &value);
992 		if (len < 0)
993 			return len;
994 
995 		i += len;
996 		if (value == 0x7FFFFFFF)
997 			pkt_dev->delay = ULLONG_MAX;
998 		else
999 			pkt_dev->delay = (u64)value;
1000 
1001 		sprintf(pg_result, "OK: delay=%llu",
1002 			(unsigned long long) pkt_dev->delay);
1003 		return count;
1004 	}
1005 	if (!strcmp(name, "rate")) {
1006 		len = num_arg(&user_buffer[i], 10, &value);
1007 		if (len < 0)
1008 			return len;
1009 
1010 		i += len;
1011 		if (!value)
1012 			return len;
1013 		pkt_dev->delay = pkt_dev->min_pkt_size*8*NSEC_PER_USEC/value;
1014 		if (debug)
1015 			pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
1016 
1017 		sprintf(pg_result, "OK: rate=%lu", value);
1018 		return count;
1019 	}
1020 	if (!strcmp(name, "ratep")) {
1021 		len = num_arg(&user_buffer[i], 10, &value);
1022 		if (len < 0)
1023 			return len;
1024 
1025 		i += len;
1026 		if (!value)
1027 			return len;
1028 		pkt_dev->delay = NSEC_PER_SEC/value;
1029 		if (debug)
1030 			pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
1031 
1032 		sprintf(pg_result, "OK: rate=%lu", value);
1033 		return count;
1034 	}
1035 	if (!strcmp(name, "udp_src_min")) {
1036 		len = num_arg(&user_buffer[i], 10, &value);
1037 		if (len < 0)
1038 			return len;
1039 
1040 		i += len;
1041 		if (value != pkt_dev->udp_src_min) {
1042 			pkt_dev->udp_src_min = value;
1043 			pkt_dev->cur_udp_src = value;
1044 		}
1045 		sprintf(pg_result, "OK: udp_src_min=%u", pkt_dev->udp_src_min);
1046 		return count;
1047 	}
1048 	if (!strcmp(name, "udp_dst_min")) {
1049 		len = num_arg(&user_buffer[i], 10, &value);
1050 		if (len < 0)
1051 			return len;
1052 
1053 		i += len;
1054 		if (value != pkt_dev->udp_dst_min) {
1055 			pkt_dev->udp_dst_min = value;
1056 			pkt_dev->cur_udp_dst = value;
1057 		}
1058 		sprintf(pg_result, "OK: udp_dst_min=%u", pkt_dev->udp_dst_min);
1059 		return count;
1060 	}
1061 	if (!strcmp(name, "udp_src_max")) {
1062 		len = num_arg(&user_buffer[i], 10, &value);
1063 		if (len < 0)
1064 			return len;
1065 
1066 		i += len;
1067 		if (value != pkt_dev->udp_src_max) {
1068 			pkt_dev->udp_src_max = value;
1069 			pkt_dev->cur_udp_src = value;
1070 		}
1071 		sprintf(pg_result, "OK: udp_src_max=%u", pkt_dev->udp_src_max);
1072 		return count;
1073 	}
1074 	if (!strcmp(name, "udp_dst_max")) {
1075 		len = num_arg(&user_buffer[i], 10, &value);
1076 		if (len < 0)
1077 			return len;
1078 
1079 		i += len;
1080 		if (value != pkt_dev->udp_dst_max) {
1081 			pkt_dev->udp_dst_max = value;
1082 			pkt_dev->cur_udp_dst = value;
1083 		}
1084 		sprintf(pg_result, "OK: udp_dst_max=%u", pkt_dev->udp_dst_max);
1085 		return count;
1086 	}
1087 	if (!strcmp(name, "clone_skb")) {
1088 		len = num_arg(&user_buffer[i], 10, &value);
1089 		if (len < 0)
1090 			return len;
1091 		if ((value > 0) &&
1092 		    ((pkt_dev->xmit_mode == M_NETIF_RECEIVE) ||
1093 		     !(pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)))
1094 			return -ENOTSUPP;
1095 		i += len;
1096 		pkt_dev->clone_skb = value;
1097 
1098 		sprintf(pg_result, "OK: clone_skb=%d", pkt_dev->clone_skb);
1099 		return count;
1100 	}
1101 	if (!strcmp(name, "count")) {
1102 		len = num_arg(&user_buffer[i], 10, &value);
1103 		if (len < 0)
1104 			return len;
1105 
1106 		i += len;
1107 		pkt_dev->count = value;
1108 		sprintf(pg_result, "OK: count=%llu",
1109 			(unsigned long long)pkt_dev->count);
1110 		return count;
1111 	}
1112 	if (!strcmp(name, "src_mac_count")) {
1113 		len = num_arg(&user_buffer[i], 10, &value);
1114 		if (len < 0)
1115 			return len;
1116 
1117 		i += len;
1118 		if (pkt_dev->src_mac_count != value) {
1119 			pkt_dev->src_mac_count = value;
1120 			pkt_dev->cur_src_mac_offset = 0;
1121 		}
1122 		sprintf(pg_result, "OK: src_mac_count=%d",
1123 			pkt_dev->src_mac_count);
1124 		return count;
1125 	}
1126 	if (!strcmp(name, "dst_mac_count")) {
1127 		len = num_arg(&user_buffer[i], 10, &value);
1128 		if (len < 0)
1129 			return len;
1130 
1131 		i += len;
1132 		if (pkt_dev->dst_mac_count != value) {
1133 			pkt_dev->dst_mac_count = value;
1134 			pkt_dev->cur_dst_mac_offset = 0;
1135 		}
1136 		sprintf(pg_result, "OK: dst_mac_count=%d",
1137 			pkt_dev->dst_mac_count);
1138 		return count;
1139 	}
1140 	if (!strcmp(name, "burst")) {
1141 		len = num_arg(&user_buffer[i], 10, &value);
1142 		if (len < 0)
1143 			return len;
1144 
1145 		i += len;
1146 		if ((value > 1) && (pkt_dev->xmit_mode == M_START_XMIT) &&
1147 		    (!(pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)))
1148 			return -ENOTSUPP;
1149 		pkt_dev->burst = value < 1 ? 1 : value;
1150 		sprintf(pg_result, "OK: burst=%d", pkt_dev->burst);
1151 		return count;
1152 	}
1153 	if (!strcmp(name, "node")) {
1154 		len = num_arg(&user_buffer[i], 10, &value);
1155 		if (len < 0)
1156 			return len;
1157 
1158 		i += len;
1159 
1160 		if (node_possible(value)) {
1161 			pkt_dev->node = value;
1162 			sprintf(pg_result, "OK: node=%d", pkt_dev->node);
1163 			if (pkt_dev->page) {
1164 				put_page(pkt_dev->page);
1165 				pkt_dev->page = NULL;
1166 			}
1167 		}
1168 		else
1169 			sprintf(pg_result, "ERROR: node not possible");
1170 		return count;
1171 	}
1172 	if (!strcmp(name, "xmit_mode")) {
1173 		char f[32];
1174 
1175 		memset(f, 0, 32);
1176 		len = strn_len(&user_buffer[i], sizeof(f) - 1);
1177 		if (len < 0)
1178 			return len;
1179 
1180 		if (copy_from_user(f, &user_buffer[i], len))
1181 			return -EFAULT;
1182 		i += len;
1183 
1184 		if (strcmp(f, "start_xmit") == 0) {
1185 			pkt_dev->xmit_mode = M_START_XMIT;
1186 		} else if (strcmp(f, "netif_receive") == 0) {
1187 			/* clone_skb set earlier, not supported in this mode */
1188 			if (pkt_dev->clone_skb > 0)
1189 				return -ENOTSUPP;
1190 
1191 			pkt_dev->xmit_mode = M_NETIF_RECEIVE;
1192 
1193 			/* make sure new packet is allocated every time
1194 			 * pktgen_xmit() is called
1195 			 */
1196 			pkt_dev->last_ok = 1;
1197 
1198 			/* override clone_skb if user passed default value
1199 			 * at module loading time
1200 			 */
1201 			pkt_dev->clone_skb = 0;
1202 		} else {
1203 			sprintf(pg_result,
1204 				"xmit_mode -:%s:- unknown\nAvailable modes: %s",
1205 				f, "start_xmit, netif_receive\n");
1206 			return count;
1207 		}
1208 		sprintf(pg_result, "OK: xmit_mode=%s", f);
1209 		return count;
1210 	}
1211 	if (!strcmp(name, "flag")) {
1212 		char f[32];
1213 		memset(f, 0, 32);
1214 		len = strn_len(&user_buffer[i], sizeof(f) - 1);
1215 		if (len < 0)
1216 			return len;
1217 
1218 		if (copy_from_user(f, &user_buffer[i], len))
1219 			return -EFAULT;
1220 		i += len;
1221 		if (strcmp(f, "IPSRC_RND") == 0)
1222 			pkt_dev->flags |= F_IPSRC_RND;
1223 
1224 		else if (strcmp(f, "!IPSRC_RND") == 0)
1225 			pkt_dev->flags &= ~F_IPSRC_RND;
1226 
1227 		else if (strcmp(f, "TXSIZE_RND") == 0)
1228 			pkt_dev->flags |= F_TXSIZE_RND;
1229 
1230 		else if (strcmp(f, "!TXSIZE_RND") == 0)
1231 			pkt_dev->flags &= ~F_TXSIZE_RND;
1232 
1233 		else if (strcmp(f, "IPDST_RND") == 0)
1234 			pkt_dev->flags |= F_IPDST_RND;
1235 
1236 		else if (strcmp(f, "!IPDST_RND") == 0)
1237 			pkt_dev->flags &= ~F_IPDST_RND;
1238 
1239 		else if (strcmp(f, "UDPSRC_RND") == 0)
1240 			pkt_dev->flags |= F_UDPSRC_RND;
1241 
1242 		else if (strcmp(f, "!UDPSRC_RND") == 0)
1243 			pkt_dev->flags &= ~F_UDPSRC_RND;
1244 
1245 		else if (strcmp(f, "UDPDST_RND") == 0)
1246 			pkt_dev->flags |= F_UDPDST_RND;
1247 
1248 		else if (strcmp(f, "!UDPDST_RND") == 0)
1249 			pkt_dev->flags &= ~F_UDPDST_RND;
1250 
1251 		else if (strcmp(f, "MACSRC_RND") == 0)
1252 			pkt_dev->flags |= F_MACSRC_RND;
1253 
1254 		else if (strcmp(f, "!MACSRC_RND") == 0)
1255 			pkt_dev->flags &= ~F_MACSRC_RND;
1256 
1257 		else if (strcmp(f, "MACDST_RND") == 0)
1258 			pkt_dev->flags |= F_MACDST_RND;
1259 
1260 		else if (strcmp(f, "!MACDST_RND") == 0)
1261 			pkt_dev->flags &= ~F_MACDST_RND;
1262 
1263 		else if (strcmp(f, "MPLS_RND") == 0)
1264 			pkt_dev->flags |= F_MPLS_RND;
1265 
1266 		else if (strcmp(f, "!MPLS_RND") == 0)
1267 			pkt_dev->flags &= ~F_MPLS_RND;
1268 
1269 		else if (strcmp(f, "VID_RND") == 0)
1270 			pkt_dev->flags |= F_VID_RND;
1271 
1272 		else if (strcmp(f, "!VID_RND") == 0)
1273 			pkt_dev->flags &= ~F_VID_RND;
1274 
1275 		else if (strcmp(f, "SVID_RND") == 0)
1276 			pkt_dev->flags |= F_SVID_RND;
1277 
1278 		else if (strcmp(f, "!SVID_RND") == 0)
1279 			pkt_dev->flags &= ~F_SVID_RND;
1280 
1281 		else if (strcmp(f, "FLOW_SEQ") == 0)
1282 			pkt_dev->flags |= F_FLOW_SEQ;
1283 
1284 		else if (strcmp(f, "QUEUE_MAP_RND") == 0)
1285 			pkt_dev->flags |= F_QUEUE_MAP_RND;
1286 
1287 		else if (strcmp(f, "!QUEUE_MAP_RND") == 0)
1288 			pkt_dev->flags &= ~F_QUEUE_MAP_RND;
1289 
1290 		else if (strcmp(f, "QUEUE_MAP_CPU") == 0)
1291 			pkt_dev->flags |= F_QUEUE_MAP_CPU;
1292 
1293 		else if (strcmp(f, "!QUEUE_MAP_CPU") == 0)
1294 			pkt_dev->flags &= ~F_QUEUE_MAP_CPU;
1295 #ifdef CONFIG_XFRM
1296 		else if (strcmp(f, "IPSEC") == 0)
1297 			pkt_dev->flags |= F_IPSEC_ON;
1298 #endif
1299 
1300 		else if (strcmp(f, "!IPV6") == 0)
1301 			pkt_dev->flags &= ~F_IPV6;
1302 
1303 		else if (strcmp(f, "NODE_ALLOC") == 0)
1304 			pkt_dev->flags |= F_NODE;
1305 
1306 		else if (strcmp(f, "!NODE_ALLOC") == 0)
1307 			pkt_dev->flags &= ~F_NODE;
1308 
1309 		else if (strcmp(f, "UDPCSUM") == 0)
1310 			pkt_dev->flags |= F_UDPCSUM;
1311 
1312 		else if (strcmp(f, "!UDPCSUM") == 0)
1313 			pkt_dev->flags &= ~F_UDPCSUM;
1314 
1315 		else if (strcmp(f, "NO_TIMESTAMP") == 0)
1316 			pkt_dev->flags |= F_NO_TIMESTAMP;
1317 
1318 		else if (strcmp(f, "!NO_TIMESTAMP") == 0)
1319 			pkt_dev->flags &= ~F_NO_TIMESTAMP;
1320 
1321 		else {
1322 			sprintf(pg_result,
1323 				"Flag -:%s:- unknown\nAvailable flags, (prepend ! to un-set flag):\n%s",
1324 				f,
1325 				"IPSRC_RND, IPDST_RND, UDPSRC_RND, UDPDST_RND, "
1326 				"MACSRC_RND, MACDST_RND, TXSIZE_RND, IPV6, "
1327 				"MPLS_RND, VID_RND, SVID_RND, FLOW_SEQ, "
1328 				"QUEUE_MAP_RND, QUEUE_MAP_CPU, UDPCSUM, "
1329 				"NO_TIMESTAMP, "
1330 #ifdef CONFIG_XFRM
1331 				"IPSEC, "
1332 #endif
1333 				"NODE_ALLOC\n");
1334 			return count;
1335 		}
1336 		sprintf(pg_result, "OK: flags=0x%x", pkt_dev->flags);
1337 		return count;
1338 	}
1339 	if (!strcmp(name, "dst_min") || !strcmp(name, "dst")) {
1340 		len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_min) - 1);
1341 		if (len < 0)
1342 			return len;
1343 
1344 		if (copy_from_user(buf, &user_buffer[i], len))
1345 			return -EFAULT;
1346 		buf[len] = 0;
1347 		if (strcmp(buf, pkt_dev->dst_min) != 0) {
1348 			memset(pkt_dev->dst_min, 0, sizeof(pkt_dev->dst_min));
1349 			strncpy(pkt_dev->dst_min, buf, len);
1350 			pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
1351 			pkt_dev->cur_daddr = pkt_dev->daddr_min;
1352 		}
1353 		if (debug)
1354 			pr_debug("dst_min set to: %s\n", pkt_dev->dst_min);
1355 		i += len;
1356 		sprintf(pg_result, "OK: dst_min=%s", pkt_dev->dst_min);
1357 		return count;
1358 	}
1359 	if (!strcmp(name, "dst_max")) {
1360 		len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_max) - 1);
1361 		if (len < 0)
1362 			return len;
1363 
1364 
1365 		if (copy_from_user(buf, &user_buffer[i], len))
1366 			return -EFAULT;
1367 
1368 		buf[len] = 0;
1369 		if (strcmp(buf, pkt_dev->dst_max) != 0) {
1370 			memset(pkt_dev->dst_max, 0, sizeof(pkt_dev->dst_max));
1371 			strncpy(pkt_dev->dst_max, buf, len);
1372 			pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
1373 			pkt_dev->cur_daddr = pkt_dev->daddr_max;
1374 		}
1375 		if (debug)
1376 			pr_debug("dst_max set to: %s\n", pkt_dev->dst_max);
1377 		i += len;
1378 		sprintf(pg_result, "OK: dst_max=%s", pkt_dev->dst_max);
1379 		return count;
1380 	}
1381 	if (!strcmp(name, "dst6")) {
1382 		len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1383 		if (len < 0)
1384 			return len;
1385 
1386 		pkt_dev->flags |= F_IPV6;
1387 
1388 		if (copy_from_user(buf, &user_buffer[i], len))
1389 			return -EFAULT;
1390 		buf[len] = 0;
1391 
1392 		in6_pton(buf, -1, pkt_dev->in6_daddr.s6_addr, -1, NULL);
1393 		snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_daddr);
1394 
1395 		pkt_dev->cur_in6_daddr = pkt_dev->in6_daddr;
1396 
1397 		if (debug)
1398 			pr_debug("dst6 set to: %s\n", buf);
1399 
1400 		i += len;
1401 		sprintf(pg_result, "OK: dst6=%s", buf);
1402 		return count;
1403 	}
1404 	if (!strcmp(name, "dst6_min")) {
1405 		len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1406 		if (len < 0)
1407 			return len;
1408 
1409 		pkt_dev->flags |= F_IPV6;
1410 
1411 		if (copy_from_user(buf, &user_buffer[i], len))
1412 			return -EFAULT;
1413 		buf[len] = 0;
1414 
1415 		in6_pton(buf, -1, pkt_dev->min_in6_daddr.s6_addr, -1, NULL);
1416 		snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->min_in6_daddr);
1417 
1418 		pkt_dev->cur_in6_daddr = pkt_dev->min_in6_daddr;
1419 		if (debug)
1420 			pr_debug("dst6_min set to: %s\n", buf);
1421 
1422 		i += len;
1423 		sprintf(pg_result, "OK: dst6_min=%s", buf);
1424 		return count;
1425 	}
1426 	if (!strcmp(name, "dst6_max")) {
1427 		len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1428 		if (len < 0)
1429 			return len;
1430 
1431 		pkt_dev->flags |= F_IPV6;
1432 
1433 		if (copy_from_user(buf, &user_buffer[i], len))
1434 			return -EFAULT;
1435 		buf[len] = 0;
1436 
1437 		in6_pton(buf, -1, pkt_dev->max_in6_daddr.s6_addr, -1, NULL);
1438 		snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->max_in6_daddr);
1439 
1440 		if (debug)
1441 			pr_debug("dst6_max set to: %s\n", buf);
1442 
1443 		i += len;
1444 		sprintf(pg_result, "OK: dst6_max=%s", buf);
1445 		return count;
1446 	}
1447 	if (!strcmp(name, "src6")) {
1448 		len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1449 		if (len < 0)
1450 			return len;
1451 
1452 		pkt_dev->flags |= F_IPV6;
1453 
1454 		if (copy_from_user(buf, &user_buffer[i], len))
1455 			return -EFAULT;
1456 		buf[len] = 0;
1457 
1458 		in6_pton(buf, -1, pkt_dev->in6_saddr.s6_addr, -1, NULL);
1459 		snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_saddr);
1460 
1461 		pkt_dev->cur_in6_saddr = pkt_dev->in6_saddr;
1462 
1463 		if (debug)
1464 			pr_debug("src6 set to: %s\n", buf);
1465 
1466 		i += len;
1467 		sprintf(pg_result, "OK: src6=%s", buf);
1468 		return count;
1469 	}
1470 	if (!strcmp(name, "src_min")) {
1471 		len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_min) - 1);
1472 		if (len < 0)
1473 			return len;
1474 
1475 		if (copy_from_user(buf, &user_buffer[i], len))
1476 			return -EFAULT;
1477 		buf[len] = 0;
1478 		if (strcmp(buf, pkt_dev->src_min) != 0) {
1479 			memset(pkt_dev->src_min, 0, sizeof(pkt_dev->src_min));
1480 			strncpy(pkt_dev->src_min, buf, len);
1481 			pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
1482 			pkt_dev->cur_saddr = pkt_dev->saddr_min;
1483 		}
1484 		if (debug)
1485 			pr_debug("src_min set to: %s\n", pkt_dev->src_min);
1486 		i += len;
1487 		sprintf(pg_result, "OK: src_min=%s", pkt_dev->src_min);
1488 		return count;
1489 	}
1490 	if (!strcmp(name, "src_max")) {
1491 		len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_max) - 1);
1492 		if (len < 0)
1493 			return len;
1494 
1495 		if (copy_from_user(buf, &user_buffer[i], len))
1496 			return -EFAULT;
1497 		buf[len] = 0;
1498 		if (strcmp(buf, pkt_dev->src_max) != 0) {
1499 			memset(pkt_dev->src_max, 0, sizeof(pkt_dev->src_max));
1500 			strncpy(pkt_dev->src_max, buf, len);
1501 			pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
1502 			pkt_dev->cur_saddr = pkt_dev->saddr_max;
1503 		}
1504 		if (debug)
1505 			pr_debug("src_max set to: %s\n", pkt_dev->src_max);
1506 		i += len;
1507 		sprintf(pg_result, "OK: src_max=%s", pkt_dev->src_max);
1508 		return count;
1509 	}
1510 	if (!strcmp(name, "dst_mac")) {
1511 		len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1512 		if (len < 0)
1513 			return len;
1514 
1515 		memset(valstr, 0, sizeof(valstr));
1516 		if (copy_from_user(valstr, &user_buffer[i], len))
1517 			return -EFAULT;
1518 
1519 		if (!mac_pton(valstr, pkt_dev->dst_mac))
1520 			return -EINVAL;
1521 		/* Set up Dest MAC */
1522 		ether_addr_copy(&pkt_dev->hh[0], pkt_dev->dst_mac);
1523 
1524 		sprintf(pg_result, "OK: dstmac %pM", pkt_dev->dst_mac);
1525 		return count;
1526 	}
1527 	if (!strcmp(name, "src_mac")) {
1528 		len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1529 		if (len < 0)
1530 			return len;
1531 
1532 		memset(valstr, 0, sizeof(valstr));
1533 		if (copy_from_user(valstr, &user_buffer[i], len))
1534 			return -EFAULT;
1535 
1536 		if (!mac_pton(valstr, pkt_dev->src_mac))
1537 			return -EINVAL;
1538 		/* Set up Src MAC */
1539 		ether_addr_copy(&pkt_dev->hh[6], pkt_dev->src_mac);
1540 
1541 		sprintf(pg_result, "OK: srcmac %pM", pkt_dev->src_mac);
1542 		return count;
1543 	}
1544 
1545 	if (!strcmp(name, "clear_counters")) {
1546 		pktgen_clear_counters(pkt_dev);
1547 		sprintf(pg_result, "OK: Clearing counters.\n");
1548 		return count;
1549 	}
1550 
1551 	if (!strcmp(name, "flows")) {
1552 		len = num_arg(&user_buffer[i], 10, &value);
1553 		if (len < 0)
1554 			return len;
1555 
1556 		i += len;
1557 		if (value > MAX_CFLOWS)
1558 			value = MAX_CFLOWS;
1559 
1560 		pkt_dev->cflows = value;
1561 		sprintf(pg_result, "OK: flows=%u", pkt_dev->cflows);
1562 		return count;
1563 	}
1564 #ifdef CONFIG_XFRM
1565 	if (!strcmp(name, "spi")) {
1566 		len = num_arg(&user_buffer[i], 10, &value);
1567 		if (len < 0)
1568 			return len;
1569 
1570 		i += len;
1571 		pkt_dev->spi = value;
1572 		sprintf(pg_result, "OK: spi=%u", pkt_dev->spi);
1573 		return count;
1574 	}
1575 #endif
1576 	if (!strcmp(name, "flowlen")) {
1577 		len = num_arg(&user_buffer[i], 10, &value);
1578 		if (len < 0)
1579 			return len;
1580 
1581 		i += len;
1582 		pkt_dev->lflow = value;
1583 		sprintf(pg_result, "OK: flowlen=%u", pkt_dev->lflow);
1584 		return count;
1585 	}
1586 
1587 	if (!strcmp(name, "queue_map_min")) {
1588 		len = num_arg(&user_buffer[i], 5, &value);
1589 		if (len < 0)
1590 			return len;
1591 
1592 		i += len;
1593 		pkt_dev->queue_map_min = value;
1594 		sprintf(pg_result, "OK: queue_map_min=%u", pkt_dev->queue_map_min);
1595 		return count;
1596 	}
1597 
1598 	if (!strcmp(name, "queue_map_max")) {
1599 		len = num_arg(&user_buffer[i], 5, &value);
1600 		if (len < 0)
1601 			return len;
1602 
1603 		i += len;
1604 		pkt_dev->queue_map_max = value;
1605 		sprintf(pg_result, "OK: queue_map_max=%u", pkt_dev->queue_map_max);
1606 		return count;
1607 	}
1608 
1609 	if (!strcmp(name, "mpls")) {
1610 		unsigned int n, cnt;
1611 
1612 		len = get_labels(&user_buffer[i], pkt_dev);
1613 		if (len < 0)
1614 			return len;
1615 		i += len;
1616 		cnt = sprintf(pg_result, "OK: mpls=");
1617 		for (n = 0; n < pkt_dev->nr_labels; n++)
1618 			cnt += sprintf(pg_result + cnt,
1619 				       "%08x%s", ntohl(pkt_dev->labels[n]),
1620 				       n == pkt_dev->nr_labels-1 ? "" : ",");
1621 
1622 		if (pkt_dev->nr_labels && pkt_dev->vlan_id != 0xffff) {
1623 			pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1624 			pkt_dev->svlan_id = 0xffff;
1625 
1626 			if (debug)
1627 				pr_debug("VLAN/SVLAN auto turned off\n");
1628 		}
1629 		return count;
1630 	}
1631 
1632 	if (!strcmp(name, "vlan_id")) {
1633 		len = num_arg(&user_buffer[i], 4, &value);
1634 		if (len < 0)
1635 			return len;
1636 
1637 		i += len;
1638 		if (value <= 4095) {
1639 			pkt_dev->vlan_id = value;  /* turn on VLAN */
1640 
1641 			if (debug)
1642 				pr_debug("VLAN turned on\n");
1643 
1644 			if (debug && pkt_dev->nr_labels)
1645 				pr_debug("MPLS auto turned off\n");
1646 
1647 			pkt_dev->nr_labels = 0;    /* turn off MPLS */
1648 			sprintf(pg_result, "OK: vlan_id=%u", pkt_dev->vlan_id);
1649 		} else {
1650 			pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1651 			pkt_dev->svlan_id = 0xffff;
1652 
1653 			if (debug)
1654 				pr_debug("VLAN/SVLAN turned off\n");
1655 		}
1656 		return count;
1657 	}
1658 
1659 	if (!strcmp(name, "vlan_p")) {
1660 		len = num_arg(&user_buffer[i], 1, &value);
1661 		if (len < 0)
1662 			return len;
1663 
1664 		i += len;
1665 		if ((value <= 7) && (pkt_dev->vlan_id != 0xffff)) {
1666 			pkt_dev->vlan_p = value;
1667 			sprintf(pg_result, "OK: vlan_p=%u", pkt_dev->vlan_p);
1668 		} else {
1669 			sprintf(pg_result, "ERROR: vlan_p must be 0-7");
1670 		}
1671 		return count;
1672 	}
1673 
1674 	if (!strcmp(name, "vlan_cfi")) {
1675 		len = num_arg(&user_buffer[i], 1, &value);
1676 		if (len < 0)
1677 			return len;
1678 
1679 		i += len;
1680 		if ((value <= 1) && (pkt_dev->vlan_id != 0xffff)) {
1681 			pkt_dev->vlan_cfi = value;
1682 			sprintf(pg_result, "OK: vlan_cfi=%u", pkt_dev->vlan_cfi);
1683 		} else {
1684 			sprintf(pg_result, "ERROR: vlan_cfi must be 0-1");
1685 		}
1686 		return count;
1687 	}
1688 
1689 	if (!strcmp(name, "svlan_id")) {
1690 		len = num_arg(&user_buffer[i], 4, &value);
1691 		if (len < 0)
1692 			return len;
1693 
1694 		i += len;
1695 		if ((value <= 4095) && ((pkt_dev->vlan_id != 0xffff))) {
1696 			pkt_dev->svlan_id = value;  /* turn on SVLAN */
1697 
1698 			if (debug)
1699 				pr_debug("SVLAN turned on\n");
1700 
1701 			if (debug && pkt_dev->nr_labels)
1702 				pr_debug("MPLS auto turned off\n");
1703 
1704 			pkt_dev->nr_labels = 0;    /* turn off MPLS */
1705 			sprintf(pg_result, "OK: svlan_id=%u", pkt_dev->svlan_id);
1706 		} else {
1707 			pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1708 			pkt_dev->svlan_id = 0xffff;
1709 
1710 			if (debug)
1711 				pr_debug("VLAN/SVLAN turned off\n");
1712 		}
1713 		return count;
1714 	}
1715 
1716 	if (!strcmp(name, "svlan_p")) {
1717 		len = num_arg(&user_buffer[i], 1, &value);
1718 		if (len < 0)
1719 			return len;
1720 
1721 		i += len;
1722 		if ((value <= 7) && (pkt_dev->svlan_id != 0xffff)) {
1723 			pkt_dev->svlan_p = value;
1724 			sprintf(pg_result, "OK: svlan_p=%u", pkt_dev->svlan_p);
1725 		} else {
1726 			sprintf(pg_result, "ERROR: svlan_p must be 0-7");
1727 		}
1728 		return count;
1729 	}
1730 
1731 	if (!strcmp(name, "svlan_cfi")) {
1732 		len = num_arg(&user_buffer[i], 1, &value);
1733 		if (len < 0)
1734 			return len;
1735 
1736 		i += len;
1737 		if ((value <= 1) && (pkt_dev->svlan_id != 0xffff)) {
1738 			pkt_dev->svlan_cfi = value;
1739 			sprintf(pg_result, "OK: svlan_cfi=%u", pkt_dev->svlan_cfi);
1740 		} else {
1741 			sprintf(pg_result, "ERROR: svlan_cfi must be 0-1");
1742 		}
1743 		return count;
1744 	}
1745 
1746 	if (!strcmp(name, "tos")) {
1747 		__u32 tmp_value = 0;
1748 		len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1749 		if (len < 0)
1750 			return len;
1751 
1752 		i += len;
1753 		if (len == 2) {
1754 			pkt_dev->tos = tmp_value;
1755 			sprintf(pg_result, "OK: tos=0x%02x", pkt_dev->tos);
1756 		} else {
1757 			sprintf(pg_result, "ERROR: tos must be 00-ff");
1758 		}
1759 		return count;
1760 	}
1761 
1762 	if (!strcmp(name, "traffic_class")) {
1763 		__u32 tmp_value = 0;
1764 		len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1765 		if (len < 0)
1766 			return len;
1767 
1768 		i += len;
1769 		if (len == 2) {
1770 			pkt_dev->traffic_class = tmp_value;
1771 			sprintf(pg_result, "OK: traffic_class=0x%02x", pkt_dev->traffic_class);
1772 		} else {
1773 			sprintf(pg_result, "ERROR: traffic_class must be 00-ff");
1774 		}
1775 		return count;
1776 	}
1777 
1778 	if (!strcmp(name, "skb_priority")) {
1779 		len = num_arg(&user_buffer[i], 9, &value);
1780 		if (len < 0)
1781 			return len;
1782 
1783 		i += len;
1784 		pkt_dev->skb_priority = value;
1785 		sprintf(pg_result, "OK: skb_priority=%i",
1786 			pkt_dev->skb_priority);
1787 		return count;
1788 	}
1789 
1790 	sprintf(pkt_dev->result, "No such parameter \"%s\"", name);
1791 	return -EINVAL;
1792 }
1793 
1794 static int pktgen_if_open(struct inode *inode, struct file *file)
1795 {
1796 	return single_open(file, pktgen_if_show, PDE_DATA(inode));
1797 }
1798 
1799 static const struct file_operations pktgen_if_fops = {
1800 	.owner   = THIS_MODULE,
1801 	.open    = pktgen_if_open,
1802 	.read    = seq_read,
1803 	.llseek  = seq_lseek,
1804 	.write   = pktgen_if_write,
1805 	.release = single_release,
1806 };
1807 
1808 static int pktgen_thread_show(struct seq_file *seq, void *v)
1809 {
1810 	struct pktgen_thread *t = seq->private;
1811 	const struct pktgen_dev *pkt_dev;
1812 
1813 	BUG_ON(!t);
1814 
1815 	seq_puts(seq, "Running: ");
1816 
1817 	rcu_read_lock();
1818 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list)
1819 		if (pkt_dev->running)
1820 			seq_printf(seq, "%s ", pkt_dev->odevname);
1821 
1822 	seq_puts(seq, "\nStopped: ");
1823 
1824 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list)
1825 		if (!pkt_dev->running)
1826 			seq_printf(seq, "%s ", pkt_dev->odevname);
1827 
1828 	if (t->result[0])
1829 		seq_printf(seq, "\nResult: %s\n", t->result);
1830 	else
1831 		seq_puts(seq, "\nResult: NA\n");
1832 
1833 	rcu_read_unlock();
1834 
1835 	return 0;
1836 }
1837 
1838 static ssize_t pktgen_thread_write(struct file *file,
1839 				   const char __user * user_buffer,
1840 				   size_t count, loff_t * offset)
1841 {
1842 	struct seq_file *seq = file->private_data;
1843 	struct pktgen_thread *t = seq->private;
1844 	int i, max, len, ret;
1845 	char name[40];
1846 	char *pg_result;
1847 
1848 	if (count < 1) {
1849 		//      sprintf(pg_result, "Wrong command format");
1850 		return -EINVAL;
1851 	}
1852 
1853 	max = count;
1854 	len = count_trail_chars(user_buffer, max);
1855 	if (len < 0)
1856 		return len;
1857 
1858 	i = len;
1859 
1860 	/* Read variable name */
1861 
1862 	len = strn_len(&user_buffer[i], sizeof(name) - 1);
1863 	if (len < 0)
1864 		return len;
1865 
1866 	memset(name, 0, sizeof(name));
1867 	if (copy_from_user(name, &user_buffer[i], len))
1868 		return -EFAULT;
1869 	i += len;
1870 
1871 	max = count - i;
1872 	len = count_trail_chars(&user_buffer[i], max);
1873 	if (len < 0)
1874 		return len;
1875 
1876 	i += len;
1877 
1878 	if (debug)
1879 		pr_debug("t=%s, count=%lu\n", name, (unsigned long)count);
1880 
1881 	if (!t) {
1882 		pr_err("ERROR: No thread\n");
1883 		ret = -EINVAL;
1884 		goto out;
1885 	}
1886 
1887 	pg_result = &(t->result[0]);
1888 
1889 	if (!strcmp(name, "add_device")) {
1890 		char f[32];
1891 		memset(f, 0, 32);
1892 		len = strn_len(&user_buffer[i], sizeof(f) - 1);
1893 		if (len < 0) {
1894 			ret = len;
1895 			goto out;
1896 		}
1897 		if (copy_from_user(f, &user_buffer[i], len))
1898 			return -EFAULT;
1899 		i += len;
1900 		mutex_lock(&pktgen_thread_lock);
1901 		ret = pktgen_add_device(t, f);
1902 		mutex_unlock(&pktgen_thread_lock);
1903 		if (!ret) {
1904 			ret = count;
1905 			sprintf(pg_result, "OK: add_device=%s", f);
1906 		} else
1907 			sprintf(pg_result, "ERROR: can not add device %s", f);
1908 		goto out;
1909 	}
1910 
1911 	if (!strcmp(name, "rem_device_all")) {
1912 		mutex_lock(&pktgen_thread_lock);
1913 		t->control |= T_REMDEVALL;
1914 		mutex_unlock(&pktgen_thread_lock);
1915 		schedule_timeout_interruptible(msecs_to_jiffies(125));	/* Propagate thread->control  */
1916 		ret = count;
1917 		sprintf(pg_result, "OK: rem_device_all");
1918 		goto out;
1919 	}
1920 
1921 	if (!strcmp(name, "max_before_softirq")) {
1922 		sprintf(pg_result, "OK: Note! max_before_softirq is obsoleted -- Do not use");
1923 		ret = count;
1924 		goto out;
1925 	}
1926 
1927 	ret = -EINVAL;
1928 out:
1929 	return ret;
1930 }
1931 
1932 static int pktgen_thread_open(struct inode *inode, struct file *file)
1933 {
1934 	return single_open(file, pktgen_thread_show, PDE_DATA(inode));
1935 }
1936 
1937 static const struct file_operations pktgen_thread_fops = {
1938 	.owner   = THIS_MODULE,
1939 	.open    = pktgen_thread_open,
1940 	.read    = seq_read,
1941 	.llseek  = seq_lseek,
1942 	.write   = pktgen_thread_write,
1943 	.release = single_release,
1944 };
1945 
1946 /* Think find or remove for NN */
1947 static struct pktgen_dev *__pktgen_NN_threads(const struct pktgen_net *pn,
1948 					      const char *ifname, int remove)
1949 {
1950 	struct pktgen_thread *t;
1951 	struct pktgen_dev *pkt_dev = NULL;
1952 	bool exact = (remove == FIND);
1953 
1954 	list_for_each_entry(t, &pn->pktgen_threads, th_list) {
1955 		pkt_dev = pktgen_find_dev(t, ifname, exact);
1956 		if (pkt_dev) {
1957 			if (remove) {
1958 				pkt_dev->removal_mark = 1;
1959 				t->control |= T_REMDEV;
1960 			}
1961 			break;
1962 		}
1963 	}
1964 	return pkt_dev;
1965 }
1966 
1967 /*
1968  * mark a device for removal
1969  */
1970 static void pktgen_mark_device(const struct pktgen_net *pn, const char *ifname)
1971 {
1972 	struct pktgen_dev *pkt_dev = NULL;
1973 	const int max_tries = 10, msec_per_try = 125;
1974 	int i = 0;
1975 
1976 	mutex_lock(&pktgen_thread_lock);
1977 	pr_debug("%s: marking %s for removal\n", __func__, ifname);
1978 
1979 	while (1) {
1980 
1981 		pkt_dev = __pktgen_NN_threads(pn, ifname, REMOVE);
1982 		if (pkt_dev == NULL)
1983 			break;	/* success */
1984 
1985 		mutex_unlock(&pktgen_thread_lock);
1986 		pr_debug("%s: waiting for %s to disappear....\n",
1987 			 __func__, ifname);
1988 		schedule_timeout_interruptible(msecs_to_jiffies(msec_per_try));
1989 		mutex_lock(&pktgen_thread_lock);
1990 
1991 		if (++i >= max_tries) {
1992 			pr_err("%s: timed out after waiting %d msec for device %s to be removed\n",
1993 			       __func__, msec_per_try * i, ifname);
1994 			break;
1995 		}
1996 
1997 	}
1998 
1999 	mutex_unlock(&pktgen_thread_lock);
2000 }
2001 
2002 static void pktgen_change_name(const struct pktgen_net *pn, struct net_device *dev)
2003 {
2004 	struct pktgen_thread *t;
2005 
2006 	list_for_each_entry(t, &pn->pktgen_threads, th_list) {
2007 		struct pktgen_dev *pkt_dev;
2008 
2009 		rcu_read_lock();
2010 		list_for_each_entry_rcu(pkt_dev, &t->if_list, list) {
2011 			if (pkt_dev->odev != dev)
2012 				continue;
2013 
2014 			proc_remove(pkt_dev->entry);
2015 
2016 			pkt_dev->entry = proc_create_data(dev->name, 0600,
2017 							  pn->proc_dir,
2018 							  &pktgen_if_fops,
2019 							  pkt_dev);
2020 			if (!pkt_dev->entry)
2021 				pr_err("can't move proc entry for '%s'\n",
2022 				       dev->name);
2023 			break;
2024 		}
2025 		rcu_read_unlock();
2026 	}
2027 }
2028 
2029 static int pktgen_device_event(struct notifier_block *unused,
2030 			       unsigned long event, void *ptr)
2031 {
2032 	struct net_device *dev = netdev_notifier_info_to_dev(ptr);
2033 	struct pktgen_net *pn = net_generic(dev_net(dev), pg_net_id);
2034 
2035 	if (pn->pktgen_exiting)
2036 		return NOTIFY_DONE;
2037 
2038 	/* It is OK that we do not hold the group lock right now,
2039 	 * as we run under the RTNL lock.
2040 	 */
2041 
2042 	switch (event) {
2043 	case NETDEV_CHANGENAME:
2044 		pktgen_change_name(pn, dev);
2045 		break;
2046 
2047 	case NETDEV_UNREGISTER:
2048 		pktgen_mark_device(pn, dev->name);
2049 		break;
2050 	}
2051 
2052 	return NOTIFY_DONE;
2053 }
2054 
2055 static struct net_device *pktgen_dev_get_by_name(const struct pktgen_net *pn,
2056 						 struct pktgen_dev *pkt_dev,
2057 						 const char *ifname)
2058 {
2059 	char b[IFNAMSIZ+5];
2060 	int i;
2061 
2062 	for (i = 0; ifname[i] != '@'; i++) {
2063 		if (i == IFNAMSIZ)
2064 			break;
2065 
2066 		b[i] = ifname[i];
2067 	}
2068 	b[i] = 0;
2069 
2070 	return dev_get_by_name(pn->net, b);
2071 }
2072 
2073 
2074 /* Associate pktgen_dev with a device. */
2075 
2076 static int pktgen_setup_dev(const struct pktgen_net *pn,
2077 			    struct pktgen_dev *pkt_dev, const char *ifname)
2078 {
2079 	struct net_device *odev;
2080 	int err;
2081 
2082 	/* Clean old setups */
2083 	if (pkt_dev->odev) {
2084 		dev_put(pkt_dev->odev);
2085 		pkt_dev->odev = NULL;
2086 	}
2087 
2088 	odev = pktgen_dev_get_by_name(pn, pkt_dev, ifname);
2089 	if (!odev) {
2090 		pr_err("no such netdevice: \"%s\"\n", ifname);
2091 		return -ENODEV;
2092 	}
2093 
2094 	if (odev->type != ARPHRD_ETHER) {
2095 		pr_err("not an ethernet device: \"%s\"\n", ifname);
2096 		err = -EINVAL;
2097 	} else if (!netif_running(odev)) {
2098 		pr_err("device is down: \"%s\"\n", ifname);
2099 		err = -ENETDOWN;
2100 	} else {
2101 		pkt_dev->odev = odev;
2102 		return 0;
2103 	}
2104 
2105 	dev_put(odev);
2106 	return err;
2107 }
2108 
2109 /* Read pkt_dev from the interface and set up internal pktgen_dev
2110  * structure to have the right information to create/send packets
2111  */
2112 static void pktgen_setup_inject(struct pktgen_dev *pkt_dev)
2113 {
2114 	int ntxq;
2115 
2116 	if (!pkt_dev->odev) {
2117 		pr_err("ERROR: pkt_dev->odev == NULL in setup_inject\n");
2118 		sprintf(pkt_dev->result,
2119 			"ERROR: pkt_dev->odev == NULL in setup_inject.\n");
2120 		return;
2121 	}
2122 
2123 	/* make sure that we don't pick a non-existing transmit queue */
2124 	ntxq = pkt_dev->odev->real_num_tx_queues;
2125 
2126 	if (ntxq <= pkt_dev->queue_map_min) {
2127 		pr_warn("WARNING: Requested queue_map_min (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2128 			pkt_dev->queue_map_min, (ntxq ?: 1) - 1, ntxq,
2129 			pkt_dev->odevname);
2130 		pkt_dev->queue_map_min = (ntxq ?: 1) - 1;
2131 	}
2132 	if (pkt_dev->queue_map_max >= ntxq) {
2133 		pr_warn("WARNING: Requested queue_map_max (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2134 			pkt_dev->queue_map_max, (ntxq ?: 1) - 1, ntxq,
2135 			pkt_dev->odevname);
2136 		pkt_dev->queue_map_max = (ntxq ?: 1) - 1;
2137 	}
2138 
2139 	/* Default to the interface's mac if not explicitly set. */
2140 
2141 	if (is_zero_ether_addr(pkt_dev->src_mac))
2142 		ether_addr_copy(&(pkt_dev->hh[6]), pkt_dev->odev->dev_addr);
2143 
2144 	/* Set up Dest MAC */
2145 	ether_addr_copy(&(pkt_dev->hh[0]), pkt_dev->dst_mac);
2146 
2147 	if (pkt_dev->flags & F_IPV6) {
2148 		int i, set = 0, err = 1;
2149 		struct inet6_dev *idev;
2150 
2151 		if (pkt_dev->min_pkt_size == 0) {
2152 			pkt_dev->min_pkt_size = 14 + sizeof(struct ipv6hdr)
2153 						+ sizeof(struct udphdr)
2154 						+ sizeof(struct pktgen_hdr)
2155 						+ pkt_dev->pkt_overhead;
2156 		}
2157 
2158 		for (i = 0; i < IN6_ADDR_HSIZE; i++)
2159 			if (pkt_dev->cur_in6_saddr.s6_addr[i]) {
2160 				set = 1;
2161 				break;
2162 			}
2163 
2164 		if (!set) {
2165 
2166 			/*
2167 			 * Use linklevel address if unconfigured.
2168 			 *
2169 			 * use ipv6_get_lladdr if/when it's get exported
2170 			 */
2171 
2172 			rcu_read_lock();
2173 			idev = __in6_dev_get(pkt_dev->odev);
2174 			if (idev) {
2175 				struct inet6_ifaddr *ifp;
2176 
2177 				read_lock_bh(&idev->lock);
2178 				list_for_each_entry(ifp, &idev->addr_list, if_list) {
2179 					if ((ifp->scope & IFA_LINK) &&
2180 					    !(ifp->flags & IFA_F_TENTATIVE)) {
2181 						pkt_dev->cur_in6_saddr = ifp->addr;
2182 						err = 0;
2183 						break;
2184 					}
2185 				}
2186 				read_unlock_bh(&idev->lock);
2187 			}
2188 			rcu_read_unlock();
2189 			if (err)
2190 				pr_err("ERROR: IPv6 link address not available\n");
2191 		}
2192 	} else {
2193 		if (pkt_dev->min_pkt_size == 0) {
2194 			pkt_dev->min_pkt_size = 14 + sizeof(struct iphdr)
2195 						+ sizeof(struct udphdr)
2196 						+ sizeof(struct pktgen_hdr)
2197 						+ pkt_dev->pkt_overhead;
2198 		}
2199 
2200 		pkt_dev->saddr_min = 0;
2201 		pkt_dev->saddr_max = 0;
2202 		if (strlen(pkt_dev->src_min) == 0) {
2203 
2204 			struct in_device *in_dev;
2205 
2206 			rcu_read_lock();
2207 			in_dev = __in_dev_get_rcu(pkt_dev->odev);
2208 			if (in_dev) {
2209 				if (in_dev->ifa_list) {
2210 					pkt_dev->saddr_min =
2211 					    in_dev->ifa_list->ifa_address;
2212 					pkt_dev->saddr_max = pkt_dev->saddr_min;
2213 				}
2214 			}
2215 			rcu_read_unlock();
2216 		} else {
2217 			pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
2218 			pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
2219 		}
2220 
2221 		pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
2222 		pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
2223 	}
2224 	/* Initialize current values. */
2225 	pkt_dev->cur_pkt_size = pkt_dev->min_pkt_size;
2226 	if (pkt_dev->min_pkt_size > pkt_dev->max_pkt_size)
2227 		pkt_dev->max_pkt_size = pkt_dev->min_pkt_size;
2228 
2229 	pkt_dev->cur_dst_mac_offset = 0;
2230 	pkt_dev->cur_src_mac_offset = 0;
2231 	pkt_dev->cur_saddr = pkt_dev->saddr_min;
2232 	pkt_dev->cur_daddr = pkt_dev->daddr_min;
2233 	pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2234 	pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2235 	pkt_dev->nflows = 0;
2236 }
2237 
2238 
2239 static void spin(struct pktgen_dev *pkt_dev, ktime_t spin_until)
2240 {
2241 	ktime_t start_time, end_time;
2242 	s64 remaining;
2243 	struct hrtimer_sleeper t;
2244 
2245 	hrtimer_init_on_stack(&t.timer, CLOCK_MONOTONIC, HRTIMER_MODE_ABS);
2246 	hrtimer_set_expires(&t.timer, spin_until);
2247 
2248 	remaining = ktime_to_ns(hrtimer_expires_remaining(&t.timer));
2249 	if (remaining <= 0) {
2250 		pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2251 		return;
2252 	}
2253 
2254 	start_time = ktime_get();
2255 	if (remaining < 100000) {
2256 		/* for small delays (<100us), just loop until limit is reached */
2257 		do {
2258 			end_time = ktime_get();
2259 		} while (ktime_compare(end_time, spin_until) < 0);
2260 	} else {
2261 		/* see do_nanosleep */
2262 		hrtimer_init_sleeper(&t, current);
2263 		do {
2264 			set_current_state(TASK_INTERRUPTIBLE);
2265 			hrtimer_start_expires(&t.timer, HRTIMER_MODE_ABS);
2266 
2267 			if (likely(t.task))
2268 				schedule();
2269 
2270 			hrtimer_cancel(&t.timer);
2271 		} while (t.task && pkt_dev->running && !signal_pending(current));
2272 		__set_current_state(TASK_RUNNING);
2273 		end_time = ktime_get();
2274 	}
2275 
2276 	pkt_dev->idle_acc += ktime_to_ns(ktime_sub(end_time, start_time));
2277 	pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2278 }
2279 
2280 static inline void set_pkt_overhead(struct pktgen_dev *pkt_dev)
2281 {
2282 	pkt_dev->pkt_overhead = 0;
2283 	pkt_dev->pkt_overhead += pkt_dev->nr_labels*sizeof(u32);
2284 	pkt_dev->pkt_overhead += VLAN_TAG_SIZE(pkt_dev);
2285 	pkt_dev->pkt_overhead += SVLAN_TAG_SIZE(pkt_dev);
2286 }
2287 
2288 static inline int f_seen(const struct pktgen_dev *pkt_dev, int flow)
2289 {
2290 	return !!(pkt_dev->flows[flow].flags & F_INIT);
2291 }
2292 
2293 static inline int f_pick(struct pktgen_dev *pkt_dev)
2294 {
2295 	int flow = pkt_dev->curfl;
2296 
2297 	if (pkt_dev->flags & F_FLOW_SEQ) {
2298 		if (pkt_dev->flows[flow].count >= pkt_dev->lflow) {
2299 			/* reset time */
2300 			pkt_dev->flows[flow].count = 0;
2301 			pkt_dev->flows[flow].flags = 0;
2302 			pkt_dev->curfl += 1;
2303 			if (pkt_dev->curfl >= pkt_dev->cflows)
2304 				pkt_dev->curfl = 0; /*reset */
2305 		}
2306 	} else {
2307 		flow = prandom_u32() % pkt_dev->cflows;
2308 		pkt_dev->curfl = flow;
2309 
2310 		if (pkt_dev->flows[flow].count > pkt_dev->lflow) {
2311 			pkt_dev->flows[flow].count = 0;
2312 			pkt_dev->flows[flow].flags = 0;
2313 		}
2314 	}
2315 
2316 	return pkt_dev->curfl;
2317 }
2318 
2319 
2320 #ifdef CONFIG_XFRM
2321 /* If there was already an IPSEC SA, we keep it as is, else
2322  * we go look for it ...
2323 */
2324 #define DUMMY_MARK 0
2325 static void get_ipsec_sa(struct pktgen_dev *pkt_dev, int flow)
2326 {
2327 	struct xfrm_state *x = pkt_dev->flows[flow].x;
2328 	struct pktgen_net *pn = net_generic(dev_net(pkt_dev->odev), pg_net_id);
2329 	if (!x) {
2330 
2331 		if (pkt_dev->spi) {
2332 			/* We need as quick as possible to find the right SA
2333 			 * Searching with minimum criteria to archieve this.
2334 			 */
2335 			x = xfrm_state_lookup_byspi(pn->net, htonl(pkt_dev->spi), AF_INET);
2336 		} else {
2337 			/* slow path: we dont already have xfrm_state */
2338 			x = xfrm_stateonly_find(pn->net, DUMMY_MARK,
2339 						(xfrm_address_t *)&pkt_dev->cur_daddr,
2340 						(xfrm_address_t *)&pkt_dev->cur_saddr,
2341 						AF_INET,
2342 						pkt_dev->ipsmode,
2343 						pkt_dev->ipsproto, 0);
2344 		}
2345 		if (x) {
2346 			pkt_dev->flows[flow].x = x;
2347 			set_pkt_overhead(pkt_dev);
2348 			pkt_dev->pkt_overhead += x->props.header_len;
2349 		}
2350 
2351 	}
2352 }
2353 #endif
2354 static void set_cur_queue_map(struct pktgen_dev *pkt_dev)
2355 {
2356 
2357 	if (pkt_dev->flags & F_QUEUE_MAP_CPU)
2358 		pkt_dev->cur_queue_map = smp_processor_id();
2359 
2360 	else if (pkt_dev->queue_map_min <= pkt_dev->queue_map_max) {
2361 		__u16 t;
2362 		if (pkt_dev->flags & F_QUEUE_MAP_RND) {
2363 			t = prandom_u32() %
2364 				(pkt_dev->queue_map_max -
2365 				 pkt_dev->queue_map_min + 1)
2366 				+ pkt_dev->queue_map_min;
2367 		} else {
2368 			t = pkt_dev->cur_queue_map + 1;
2369 			if (t > pkt_dev->queue_map_max)
2370 				t = pkt_dev->queue_map_min;
2371 		}
2372 		pkt_dev->cur_queue_map = t;
2373 	}
2374 	pkt_dev->cur_queue_map  = pkt_dev->cur_queue_map % pkt_dev->odev->real_num_tx_queues;
2375 }
2376 
2377 /* Increment/randomize headers according to flags and current values
2378  * for IP src/dest, UDP src/dst port, MAC-Addr src/dst
2379  */
2380 static void mod_cur_headers(struct pktgen_dev *pkt_dev)
2381 {
2382 	__u32 imn;
2383 	__u32 imx;
2384 	int flow = 0;
2385 
2386 	if (pkt_dev->cflows)
2387 		flow = f_pick(pkt_dev);
2388 
2389 	/*  Deal with source MAC */
2390 	if (pkt_dev->src_mac_count > 1) {
2391 		__u32 mc;
2392 		__u32 tmp;
2393 
2394 		if (pkt_dev->flags & F_MACSRC_RND)
2395 			mc = prandom_u32() % pkt_dev->src_mac_count;
2396 		else {
2397 			mc = pkt_dev->cur_src_mac_offset++;
2398 			if (pkt_dev->cur_src_mac_offset >=
2399 			    pkt_dev->src_mac_count)
2400 				pkt_dev->cur_src_mac_offset = 0;
2401 		}
2402 
2403 		tmp = pkt_dev->src_mac[5] + (mc & 0xFF);
2404 		pkt_dev->hh[11] = tmp;
2405 		tmp = (pkt_dev->src_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2406 		pkt_dev->hh[10] = tmp;
2407 		tmp = (pkt_dev->src_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2408 		pkt_dev->hh[9] = tmp;
2409 		tmp = (pkt_dev->src_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2410 		pkt_dev->hh[8] = tmp;
2411 		tmp = (pkt_dev->src_mac[1] + (tmp >> 8));
2412 		pkt_dev->hh[7] = tmp;
2413 	}
2414 
2415 	/*  Deal with Destination MAC */
2416 	if (pkt_dev->dst_mac_count > 1) {
2417 		__u32 mc;
2418 		__u32 tmp;
2419 
2420 		if (pkt_dev->flags & F_MACDST_RND)
2421 			mc = prandom_u32() % pkt_dev->dst_mac_count;
2422 
2423 		else {
2424 			mc = pkt_dev->cur_dst_mac_offset++;
2425 			if (pkt_dev->cur_dst_mac_offset >=
2426 			    pkt_dev->dst_mac_count) {
2427 				pkt_dev->cur_dst_mac_offset = 0;
2428 			}
2429 		}
2430 
2431 		tmp = pkt_dev->dst_mac[5] + (mc & 0xFF);
2432 		pkt_dev->hh[5] = tmp;
2433 		tmp = (pkt_dev->dst_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2434 		pkt_dev->hh[4] = tmp;
2435 		tmp = (pkt_dev->dst_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2436 		pkt_dev->hh[3] = tmp;
2437 		tmp = (pkt_dev->dst_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2438 		pkt_dev->hh[2] = tmp;
2439 		tmp = (pkt_dev->dst_mac[1] + (tmp >> 8));
2440 		pkt_dev->hh[1] = tmp;
2441 	}
2442 
2443 	if (pkt_dev->flags & F_MPLS_RND) {
2444 		unsigned int i;
2445 		for (i = 0; i < pkt_dev->nr_labels; i++)
2446 			if (pkt_dev->labels[i] & MPLS_STACK_BOTTOM)
2447 				pkt_dev->labels[i] = MPLS_STACK_BOTTOM |
2448 					     ((__force __be32)prandom_u32() &
2449 						      htonl(0x000fffff));
2450 	}
2451 
2452 	if ((pkt_dev->flags & F_VID_RND) && (pkt_dev->vlan_id != 0xffff)) {
2453 		pkt_dev->vlan_id = prandom_u32() & (4096 - 1);
2454 	}
2455 
2456 	if ((pkt_dev->flags & F_SVID_RND) && (pkt_dev->svlan_id != 0xffff)) {
2457 		pkt_dev->svlan_id = prandom_u32() & (4096 - 1);
2458 	}
2459 
2460 	if (pkt_dev->udp_src_min < pkt_dev->udp_src_max) {
2461 		if (pkt_dev->flags & F_UDPSRC_RND)
2462 			pkt_dev->cur_udp_src = prandom_u32() %
2463 				(pkt_dev->udp_src_max - pkt_dev->udp_src_min)
2464 				+ pkt_dev->udp_src_min;
2465 
2466 		else {
2467 			pkt_dev->cur_udp_src++;
2468 			if (pkt_dev->cur_udp_src >= pkt_dev->udp_src_max)
2469 				pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2470 		}
2471 	}
2472 
2473 	if (pkt_dev->udp_dst_min < pkt_dev->udp_dst_max) {
2474 		if (pkt_dev->flags & F_UDPDST_RND) {
2475 			pkt_dev->cur_udp_dst = prandom_u32() %
2476 				(pkt_dev->udp_dst_max - pkt_dev->udp_dst_min)
2477 				+ pkt_dev->udp_dst_min;
2478 		} else {
2479 			pkt_dev->cur_udp_dst++;
2480 			if (pkt_dev->cur_udp_dst >= pkt_dev->udp_dst_max)
2481 				pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2482 		}
2483 	}
2484 
2485 	if (!(pkt_dev->flags & F_IPV6)) {
2486 
2487 		imn = ntohl(pkt_dev->saddr_min);
2488 		imx = ntohl(pkt_dev->saddr_max);
2489 		if (imn < imx) {
2490 			__u32 t;
2491 			if (pkt_dev->flags & F_IPSRC_RND)
2492 				t = prandom_u32() % (imx - imn) + imn;
2493 			else {
2494 				t = ntohl(pkt_dev->cur_saddr);
2495 				t++;
2496 				if (t > imx)
2497 					t = imn;
2498 
2499 			}
2500 			pkt_dev->cur_saddr = htonl(t);
2501 		}
2502 
2503 		if (pkt_dev->cflows && f_seen(pkt_dev, flow)) {
2504 			pkt_dev->cur_daddr = pkt_dev->flows[flow].cur_daddr;
2505 		} else {
2506 			imn = ntohl(pkt_dev->daddr_min);
2507 			imx = ntohl(pkt_dev->daddr_max);
2508 			if (imn < imx) {
2509 				__u32 t;
2510 				__be32 s;
2511 				if (pkt_dev->flags & F_IPDST_RND) {
2512 
2513 					do {
2514 						t = prandom_u32() %
2515 							(imx - imn) + imn;
2516 						s = htonl(t);
2517 					} while (ipv4_is_loopback(s) ||
2518 						ipv4_is_multicast(s) ||
2519 						ipv4_is_lbcast(s) ||
2520 						ipv4_is_zeronet(s) ||
2521 						ipv4_is_local_multicast(s));
2522 					pkt_dev->cur_daddr = s;
2523 				} else {
2524 					t = ntohl(pkt_dev->cur_daddr);
2525 					t++;
2526 					if (t > imx) {
2527 						t = imn;
2528 					}
2529 					pkt_dev->cur_daddr = htonl(t);
2530 				}
2531 			}
2532 			if (pkt_dev->cflows) {
2533 				pkt_dev->flows[flow].flags |= F_INIT;
2534 				pkt_dev->flows[flow].cur_daddr =
2535 				    pkt_dev->cur_daddr;
2536 #ifdef CONFIG_XFRM
2537 				if (pkt_dev->flags & F_IPSEC_ON)
2538 					get_ipsec_sa(pkt_dev, flow);
2539 #endif
2540 				pkt_dev->nflows++;
2541 			}
2542 		}
2543 	} else {		/* IPV6 * */
2544 
2545 		if (!ipv6_addr_any(&pkt_dev->min_in6_daddr)) {
2546 			int i;
2547 
2548 			/* Only random destinations yet */
2549 
2550 			for (i = 0; i < 4; i++) {
2551 				pkt_dev->cur_in6_daddr.s6_addr32[i] =
2552 				    (((__force __be32)prandom_u32() |
2553 				      pkt_dev->min_in6_daddr.s6_addr32[i]) &
2554 				     pkt_dev->max_in6_daddr.s6_addr32[i]);
2555 			}
2556 		}
2557 	}
2558 
2559 	if (pkt_dev->min_pkt_size < pkt_dev->max_pkt_size) {
2560 		__u32 t;
2561 		if (pkt_dev->flags & F_TXSIZE_RND) {
2562 			t = prandom_u32() %
2563 				(pkt_dev->max_pkt_size - pkt_dev->min_pkt_size)
2564 				+ pkt_dev->min_pkt_size;
2565 		} else {
2566 			t = pkt_dev->cur_pkt_size + 1;
2567 			if (t > pkt_dev->max_pkt_size)
2568 				t = pkt_dev->min_pkt_size;
2569 		}
2570 		pkt_dev->cur_pkt_size = t;
2571 	}
2572 
2573 	set_cur_queue_map(pkt_dev);
2574 
2575 	pkt_dev->flows[flow].count++;
2576 }
2577 
2578 
2579 #ifdef CONFIG_XFRM
2580 static u32 pktgen_dst_metrics[RTAX_MAX + 1] = {
2581 
2582 	[RTAX_HOPLIMIT] = 0x5, /* Set a static hoplimit */
2583 };
2584 
2585 static int pktgen_output_ipsec(struct sk_buff *skb, struct pktgen_dev *pkt_dev)
2586 {
2587 	struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2588 	int err = 0;
2589 	struct net *net = dev_net(pkt_dev->odev);
2590 
2591 	if (!x)
2592 		return 0;
2593 	/* XXX: we dont support tunnel mode for now until
2594 	 * we resolve the dst issue */
2595 	if ((x->props.mode != XFRM_MODE_TRANSPORT) && (pkt_dev->spi == 0))
2596 		return 0;
2597 
2598 	/* But when user specify an valid SPI, transformation
2599 	 * supports both transport/tunnel mode + ESP/AH type.
2600 	 */
2601 	if ((x->props.mode == XFRM_MODE_TUNNEL) && (pkt_dev->spi != 0))
2602 		skb->_skb_refdst = (unsigned long)&pkt_dev->dst | SKB_DST_NOREF;
2603 
2604 	rcu_read_lock_bh();
2605 	err = x->outer_mode->output(x, skb);
2606 	rcu_read_unlock_bh();
2607 	if (err) {
2608 		XFRM_INC_STATS(net, LINUX_MIB_XFRMOUTSTATEMODEERROR);
2609 		goto error;
2610 	}
2611 	err = x->type->output(x, skb);
2612 	if (err) {
2613 		XFRM_INC_STATS(net, LINUX_MIB_XFRMOUTSTATEPROTOERROR);
2614 		goto error;
2615 	}
2616 	spin_lock_bh(&x->lock);
2617 	x->curlft.bytes += skb->len;
2618 	x->curlft.packets++;
2619 	spin_unlock_bh(&x->lock);
2620 error:
2621 	return err;
2622 }
2623 
2624 static void free_SAs(struct pktgen_dev *pkt_dev)
2625 {
2626 	if (pkt_dev->cflows) {
2627 		/* let go of the SAs if we have them */
2628 		int i;
2629 		for (i = 0; i < pkt_dev->cflows; i++) {
2630 			struct xfrm_state *x = pkt_dev->flows[i].x;
2631 			if (x) {
2632 				xfrm_state_put(x);
2633 				pkt_dev->flows[i].x = NULL;
2634 			}
2635 		}
2636 	}
2637 }
2638 
2639 static int process_ipsec(struct pktgen_dev *pkt_dev,
2640 			      struct sk_buff *skb, __be16 protocol)
2641 {
2642 	if (pkt_dev->flags & F_IPSEC_ON) {
2643 		struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2644 		int nhead = 0;
2645 		if (x) {
2646 			struct ethhdr *eth;
2647 			struct iphdr *iph;
2648 			int ret;
2649 
2650 			nhead = x->props.header_len - skb_headroom(skb);
2651 			if (nhead > 0) {
2652 				ret = pskb_expand_head(skb, nhead, 0, GFP_ATOMIC);
2653 				if (ret < 0) {
2654 					pr_err("Error expanding ipsec packet %d\n",
2655 					       ret);
2656 					goto err;
2657 				}
2658 			}
2659 
2660 			/* ipsec is not expecting ll header */
2661 			skb_pull(skb, ETH_HLEN);
2662 			ret = pktgen_output_ipsec(skb, pkt_dev);
2663 			if (ret) {
2664 				pr_err("Error creating ipsec packet %d\n", ret);
2665 				goto err;
2666 			}
2667 			/* restore ll */
2668 			eth = (struct ethhdr *)skb_push(skb, ETH_HLEN);
2669 			memcpy(eth, pkt_dev->hh, 2 * ETH_ALEN);
2670 			eth->h_proto = protocol;
2671 
2672 			/* Update IPv4 header len as well as checksum value */
2673 			iph = ip_hdr(skb);
2674 			iph->tot_len = htons(skb->len - ETH_HLEN);
2675 			ip_send_check(iph);
2676 		}
2677 	}
2678 	return 1;
2679 err:
2680 	kfree_skb(skb);
2681 	return 0;
2682 }
2683 #endif
2684 
2685 static void mpls_push(__be32 *mpls, struct pktgen_dev *pkt_dev)
2686 {
2687 	unsigned int i;
2688 	for (i = 0; i < pkt_dev->nr_labels; i++)
2689 		*mpls++ = pkt_dev->labels[i] & ~MPLS_STACK_BOTTOM;
2690 
2691 	mpls--;
2692 	*mpls |= MPLS_STACK_BOTTOM;
2693 }
2694 
2695 static inline __be16 build_tci(unsigned int id, unsigned int cfi,
2696 			       unsigned int prio)
2697 {
2698 	return htons(id | (cfi << 12) | (prio << 13));
2699 }
2700 
2701 static void pktgen_finalize_skb(struct pktgen_dev *pkt_dev, struct sk_buff *skb,
2702 				int datalen)
2703 {
2704 	struct timeval timestamp;
2705 	struct pktgen_hdr *pgh;
2706 
2707 	pgh = (struct pktgen_hdr *)skb_put(skb, sizeof(*pgh));
2708 	datalen -= sizeof(*pgh);
2709 
2710 	if (pkt_dev->nfrags <= 0) {
2711 		memset(skb_put(skb, datalen), 0, datalen);
2712 	} else {
2713 		int frags = pkt_dev->nfrags;
2714 		int i, len;
2715 		int frag_len;
2716 
2717 
2718 		if (frags > MAX_SKB_FRAGS)
2719 			frags = MAX_SKB_FRAGS;
2720 		len = datalen - frags * PAGE_SIZE;
2721 		if (len > 0) {
2722 			memset(skb_put(skb, len), 0, len);
2723 			datalen = frags * PAGE_SIZE;
2724 		}
2725 
2726 		i = 0;
2727 		frag_len = (datalen/frags) < PAGE_SIZE ?
2728 			   (datalen/frags) : PAGE_SIZE;
2729 		while (datalen > 0) {
2730 			if (unlikely(!pkt_dev->page)) {
2731 				int node = numa_node_id();
2732 
2733 				if (pkt_dev->node >= 0 && (pkt_dev->flags & F_NODE))
2734 					node = pkt_dev->node;
2735 				pkt_dev->page = alloc_pages_node(node, GFP_KERNEL | __GFP_ZERO, 0);
2736 				if (!pkt_dev->page)
2737 					break;
2738 			}
2739 			get_page(pkt_dev->page);
2740 			skb_frag_set_page(skb, i, pkt_dev->page);
2741 			skb_shinfo(skb)->frags[i].page_offset = 0;
2742 			/*last fragment, fill rest of data*/
2743 			if (i == (frags - 1))
2744 				skb_frag_size_set(&skb_shinfo(skb)->frags[i],
2745 				    (datalen < PAGE_SIZE ? datalen : PAGE_SIZE));
2746 			else
2747 				skb_frag_size_set(&skb_shinfo(skb)->frags[i], frag_len);
2748 			datalen -= skb_frag_size(&skb_shinfo(skb)->frags[i]);
2749 			skb->len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2750 			skb->data_len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2751 			i++;
2752 			skb_shinfo(skb)->nr_frags = i;
2753 		}
2754 	}
2755 
2756 	/* Stamp the time, and sequence number,
2757 	 * convert them to network byte order
2758 	 */
2759 	pgh->pgh_magic = htonl(PKTGEN_MAGIC);
2760 	pgh->seq_num = htonl(pkt_dev->seq_num);
2761 
2762 	if (pkt_dev->flags & F_NO_TIMESTAMP) {
2763 		pgh->tv_sec = 0;
2764 		pgh->tv_usec = 0;
2765 	} else {
2766 		do_gettimeofday(&timestamp);
2767 		pgh->tv_sec = htonl(timestamp.tv_sec);
2768 		pgh->tv_usec = htonl(timestamp.tv_usec);
2769 	}
2770 }
2771 
2772 static struct sk_buff *pktgen_alloc_skb(struct net_device *dev,
2773 					struct pktgen_dev *pkt_dev,
2774 					unsigned int extralen)
2775 {
2776 	struct sk_buff *skb = NULL;
2777 	unsigned int size = pkt_dev->cur_pkt_size + 64 + extralen +
2778 			    pkt_dev->pkt_overhead;
2779 
2780 	if (pkt_dev->flags & F_NODE) {
2781 		int node = pkt_dev->node >= 0 ? pkt_dev->node : numa_node_id();
2782 
2783 		skb = __alloc_skb(NET_SKB_PAD + size, GFP_NOWAIT, 0, node);
2784 		if (likely(skb)) {
2785 			skb_reserve(skb, NET_SKB_PAD);
2786 			skb->dev = dev;
2787 		}
2788 	} else {
2789 		 skb = __netdev_alloc_skb(dev, size, GFP_NOWAIT);
2790 	}
2791 
2792 	return skb;
2793 }
2794 
2795 static struct sk_buff *fill_packet_ipv4(struct net_device *odev,
2796 					struct pktgen_dev *pkt_dev)
2797 {
2798 	struct sk_buff *skb = NULL;
2799 	__u8 *eth;
2800 	struct udphdr *udph;
2801 	int datalen, iplen;
2802 	struct iphdr *iph;
2803 	__be16 protocol = htons(ETH_P_IP);
2804 	__be32 *mpls;
2805 	__be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2806 	__be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2807 	__be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2808 	__be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2809 	u16 queue_map;
2810 
2811 	if (pkt_dev->nr_labels)
2812 		protocol = htons(ETH_P_MPLS_UC);
2813 
2814 	if (pkt_dev->vlan_id != 0xffff)
2815 		protocol = htons(ETH_P_8021Q);
2816 
2817 	/* Update any of the values, used when we're incrementing various
2818 	 * fields.
2819 	 */
2820 	mod_cur_headers(pkt_dev);
2821 	queue_map = pkt_dev->cur_queue_map;
2822 
2823 	datalen = (odev->hard_header_len + 16) & ~0xf;
2824 
2825 	skb = pktgen_alloc_skb(odev, pkt_dev, datalen);
2826 	if (!skb) {
2827 		sprintf(pkt_dev->result, "No memory");
2828 		return NULL;
2829 	}
2830 
2831 	prefetchw(skb->data);
2832 	skb_reserve(skb, datalen);
2833 
2834 	/*  Reserve for ethernet and IP header  */
2835 	eth = (__u8 *) skb_push(skb, 14);
2836 	mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2837 	if (pkt_dev->nr_labels)
2838 		mpls_push(mpls, pkt_dev);
2839 
2840 	if (pkt_dev->vlan_id != 0xffff) {
2841 		if (pkt_dev->svlan_id != 0xffff) {
2842 			svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2843 			*svlan_tci = build_tci(pkt_dev->svlan_id,
2844 					       pkt_dev->svlan_cfi,
2845 					       pkt_dev->svlan_p);
2846 			svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2847 			*svlan_encapsulated_proto = htons(ETH_P_8021Q);
2848 		}
2849 		vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2850 		*vlan_tci = build_tci(pkt_dev->vlan_id,
2851 				      pkt_dev->vlan_cfi,
2852 				      pkt_dev->vlan_p);
2853 		vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2854 		*vlan_encapsulated_proto = htons(ETH_P_IP);
2855 	}
2856 
2857 	skb_set_mac_header(skb, 0);
2858 	skb_set_network_header(skb, skb->len);
2859 	iph = (struct iphdr *) skb_put(skb, sizeof(struct iphdr));
2860 
2861 	skb_set_transport_header(skb, skb->len);
2862 	udph = (struct udphdr *) skb_put(skb, sizeof(struct udphdr));
2863 	skb_set_queue_mapping(skb, queue_map);
2864 	skb->priority = pkt_dev->skb_priority;
2865 
2866 	memcpy(eth, pkt_dev->hh, 12);
2867 	*(__be16 *) & eth[12] = protocol;
2868 
2869 	/* Eth + IPh + UDPh + mpls */
2870 	datalen = pkt_dev->cur_pkt_size - 14 - 20 - 8 -
2871 		  pkt_dev->pkt_overhead;
2872 	if (datalen < 0 || datalen < sizeof(struct pktgen_hdr))
2873 		datalen = sizeof(struct pktgen_hdr);
2874 
2875 	udph->source = htons(pkt_dev->cur_udp_src);
2876 	udph->dest = htons(pkt_dev->cur_udp_dst);
2877 	udph->len = htons(datalen + 8);	/* DATA + udphdr */
2878 	udph->check = 0;
2879 
2880 	iph->ihl = 5;
2881 	iph->version = 4;
2882 	iph->ttl = 32;
2883 	iph->tos = pkt_dev->tos;
2884 	iph->protocol = IPPROTO_UDP;	/* UDP */
2885 	iph->saddr = pkt_dev->cur_saddr;
2886 	iph->daddr = pkt_dev->cur_daddr;
2887 	iph->id = htons(pkt_dev->ip_id);
2888 	pkt_dev->ip_id++;
2889 	iph->frag_off = 0;
2890 	iplen = 20 + 8 + datalen;
2891 	iph->tot_len = htons(iplen);
2892 	ip_send_check(iph);
2893 	skb->protocol = protocol;
2894 	skb->dev = odev;
2895 	skb->pkt_type = PACKET_HOST;
2896 
2897 	pktgen_finalize_skb(pkt_dev, skb, datalen);
2898 
2899 	if (!(pkt_dev->flags & F_UDPCSUM)) {
2900 		skb->ip_summed = CHECKSUM_NONE;
2901 	} else if (odev->features & NETIF_F_V4_CSUM) {
2902 		skb->ip_summed = CHECKSUM_PARTIAL;
2903 		skb->csum = 0;
2904 		udp4_hwcsum(skb, iph->saddr, iph->daddr);
2905 	} else {
2906 		__wsum csum = skb_checksum(skb, skb_transport_offset(skb), datalen + 8, 0);
2907 
2908 		/* add protocol-dependent pseudo-header */
2909 		udph->check = csum_tcpudp_magic(iph->saddr, iph->daddr,
2910 						datalen + 8, IPPROTO_UDP, csum);
2911 
2912 		if (udph->check == 0)
2913 			udph->check = CSUM_MANGLED_0;
2914 	}
2915 
2916 #ifdef CONFIG_XFRM
2917 	if (!process_ipsec(pkt_dev, skb, protocol))
2918 		return NULL;
2919 #endif
2920 
2921 	return skb;
2922 }
2923 
2924 static struct sk_buff *fill_packet_ipv6(struct net_device *odev,
2925 					struct pktgen_dev *pkt_dev)
2926 {
2927 	struct sk_buff *skb = NULL;
2928 	__u8 *eth;
2929 	struct udphdr *udph;
2930 	int datalen, udplen;
2931 	struct ipv6hdr *iph;
2932 	__be16 protocol = htons(ETH_P_IPV6);
2933 	__be32 *mpls;
2934 	__be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2935 	__be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2936 	__be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2937 	__be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2938 	u16 queue_map;
2939 
2940 	if (pkt_dev->nr_labels)
2941 		protocol = htons(ETH_P_MPLS_UC);
2942 
2943 	if (pkt_dev->vlan_id != 0xffff)
2944 		protocol = htons(ETH_P_8021Q);
2945 
2946 	/* Update any of the values, used when we're incrementing various
2947 	 * fields.
2948 	 */
2949 	mod_cur_headers(pkt_dev);
2950 	queue_map = pkt_dev->cur_queue_map;
2951 
2952 	skb = pktgen_alloc_skb(odev, pkt_dev, 16);
2953 	if (!skb) {
2954 		sprintf(pkt_dev->result, "No memory");
2955 		return NULL;
2956 	}
2957 
2958 	prefetchw(skb->data);
2959 	skb_reserve(skb, 16);
2960 
2961 	/*  Reserve for ethernet and IP header  */
2962 	eth = (__u8 *) skb_push(skb, 14);
2963 	mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2964 	if (pkt_dev->nr_labels)
2965 		mpls_push(mpls, pkt_dev);
2966 
2967 	if (pkt_dev->vlan_id != 0xffff) {
2968 		if (pkt_dev->svlan_id != 0xffff) {
2969 			svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2970 			*svlan_tci = build_tci(pkt_dev->svlan_id,
2971 					       pkt_dev->svlan_cfi,
2972 					       pkt_dev->svlan_p);
2973 			svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2974 			*svlan_encapsulated_proto = htons(ETH_P_8021Q);
2975 		}
2976 		vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2977 		*vlan_tci = build_tci(pkt_dev->vlan_id,
2978 				      pkt_dev->vlan_cfi,
2979 				      pkt_dev->vlan_p);
2980 		vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2981 		*vlan_encapsulated_proto = htons(ETH_P_IPV6);
2982 	}
2983 
2984 	skb_set_mac_header(skb, 0);
2985 	skb_set_network_header(skb, skb->len);
2986 	iph = (struct ipv6hdr *) skb_put(skb, sizeof(struct ipv6hdr));
2987 
2988 	skb_set_transport_header(skb, skb->len);
2989 	udph = (struct udphdr *) skb_put(skb, sizeof(struct udphdr));
2990 	skb_set_queue_mapping(skb, queue_map);
2991 	skb->priority = pkt_dev->skb_priority;
2992 
2993 	memcpy(eth, pkt_dev->hh, 12);
2994 	*(__be16 *) &eth[12] = protocol;
2995 
2996 	/* Eth + IPh + UDPh + mpls */
2997 	datalen = pkt_dev->cur_pkt_size - 14 -
2998 		  sizeof(struct ipv6hdr) - sizeof(struct udphdr) -
2999 		  pkt_dev->pkt_overhead;
3000 
3001 	if (datalen < 0 || datalen < sizeof(struct pktgen_hdr)) {
3002 		datalen = sizeof(struct pktgen_hdr);
3003 		net_info_ratelimited("increased datalen to %d\n", datalen);
3004 	}
3005 
3006 	udplen = datalen + sizeof(struct udphdr);
3007 	udph->source = htons(pkt_dev->cur_udp_src);
3008 	udph->dest = htons(pkt_dev->cur_udp_dst);
3009 	udph->len = htons(udplen);
3010 	udph->check = 0;
3011 
3012 	*(__be32 *) iph = htonl(0x60000000);	/* Version + flow */
3013 
3014 	if (pkt_dev->traffic_class) {
3015 		/* Version + traffic class + flow (0) */
3016 		*(__be32 *)iph |= htonl(0x60000000 | (pkt_dev->traffic_class << 20));
3017 	}
3018 
3019 	iph->hop_limit = 32;
3020 
3021 	iph->payload_len = htons(udplen);
3022 	iph->nexthdr = IPPROTO_UDP;
3023 
3024 	iph->daddr = pkt_dev->cur_in6_daddr;
3025 	iph->saddr = pkt_dev->cur_in6_saddr;
3026 
3027 	skb->protocol = protocol;
3028 	skb->dev = odev;
3029 	skb->pkt_type = PACKET_HOST;
3030 
3031 	pktgen_finalize_skb(pkt_dev, skb, datalen);
3032 
3033 	if (!(pkt_dev->flags & F_UDPCSUM)) {
3034 		skb->ip_summed = CHECKSUM_NONE;
3035 	} else if (odev->features & NETIF_F_V6_CSUM) {
3036 		skb->ip_summed = CHECKSUM_PARTIAL;
3037 		skb->csum_start = skb_transport_header(skb) - skb->head;
3038 		skb->csum_offset = offsetof(struct udphdr, check);
3039 		udph->check = ~csum_ipv6_magic(&iph->saddr, &iph->daddr, udplen, IPPROTO_UDP, 0);
3040 	} else {
3041 		__wsum csum = skb_checksum(skb, skb_transport_offset(skb), udplen, 0);
3042 
3043 		/* add protocol-dependent pseudo-header */
3044 		udph->check = csum_ipv6_magic(&iph->saddr, &iph->daddr, udplen, IPPROTO_UDP, csum);
3045 
3046 		if (udph->check == 0)
3047 			udph->check = CSUM_MANGLED_0;
3048 	}
3049 
3050 	return skb;
3051 }
3052 
3053 static struct sk_buff *fill_packet(struct net_device *odev,
3054 				   struct pktgen_dev *pkt_dev)
3055 {
3056 	if (pkt_dev->flags & F_IPV6)
3057 		return fill_packet_ipv6(odev, pkt_dev);
3058 	else
3059 		return fill_packet_ipv4(odev, pkt_dev);
3060 }
3061 
3062 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev)
3063 {
3064 	pkt_dev->seq_num = 1;
3065 	pkt_dev->idle_acc = 0;
3066 	pkt_dev->sofar = 0;
3067 	pkt_dev->tx_bytes = 0;
3068 	pkt_dev->errors = 0;
3069 }
3070 
3071 /* Set up structure for sending pkts, clear counters */
3072 
3073 static void pktgen_run(struct pktgen_thread *t)
3074 {
3075 	struct pktgen_dev *pkt_dev;
3076 	int started = 0;
3077 
3078 	func_enter();
3079 
3080 	rcu_read_lock();
3081 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list) {
3082 
3083 		/*
3084 		 * setup odev and create initial packet.
3085 		 */
3086 		pktgen_setup_inject(pkt_dev);
3087 
3088 		if (pkt_dev->odev) {
3089 			pktgen_clear_counters(pkt_dev);
3090 			pkt_dev->skb = NULL;
3091 			pkt_dev->started_at = pkt_dev->next_tx = ktime_get();
3092 
3093 			set_pkt_overhead(pkt_dev);
3094 
3095 			strcpy(pkt_dev->result, "Starting");
3096 			pkt_dev->running = 1;	/* Cranke yeself! */
3097 			started++;
3098 		} else
3099 			strcpy(pkt_dev->result, "Error starting");
3100 	}
3101 	rcu_read_unlock();
3102 	if (started)
3103 		t->control &= ~(T_STOP);
3104 }
3105 
3106 static void pktgen_stop_all_threads_ifs(struct pktgen_net *pn)
3107 {
3108 	struct pktgen_thread *t;
3109 
3110 	func_enter();
3111 
3112 	mutex_lock(&pktgen_thread_lock);
3113 
3114 	list_for_each_entry(t, &pn->pktgen_threads, th_list)
3115 		t->control |= T_STOP;
3116 
3117 	mutex_unlock(&pktgen_thread_lock);
3118 }
3119 
3120 static int thread_is_running(const struct pktgen_thread *t)
3121 {
3122 	const struct pktgen_dev *pkt_dev;
3123 
3124 	rcu_read_lock();
3125 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list)
3126 		if (pkt_dev->running) {
3127 			rcu_read_unlock();
3128 			return 1;
3129 		}
3130 	rcu_read_unlock();
3131 	return 0;
3132 }
3133 
3134 static int pktgen_wait_thread_run(struct pktgen_thread *t)
3135 {
3136 	while (thread_is_running(t)) {
3137 
3138 		msleep_interruptible(100);
3139 
3140 		if (signal_pending(current))
3141 			goto signal;
3142 	}
3143 	return 1;
3144 signal:
3145 	return 0;
3146 }
3147 
3148 static int pktgen_wait_all_threads_run(struct pktgen_net *pn)
3149 {
3150 	struct pktgen_thread *t;
3151 	int sig = 1;
3152 
3153 	mutex_lock(&pktgen_thread_lock);
3154 
3155 	list_for_each_entry(t, &pn->pktgen_threads, th_list) {
3156 		sig = pktgen_wait_thread_run(t);
3157 		if (sig == 0)
3158 			break;
3159 	}
3160 
3161 	if (sig == 0)
3162 		list_for_each_entry(t, &pn->pktgen_threads, th_list)
3163 			t->control |= (T_STOP);
3164 
3165 	mutex_unlock(&pktgen_thread_lock);
3166 	return sig;
3167 }
3168 
3169 static void pktgen_run_all_threads(struct pktgen_net *pn)
3170 {
3171 	struct pktgen_thread *t;
3172 
3173 	func_enter();
3174 
3175 	mutex_lock(&pktgen_thread_lock);
3176 
3177 	list_for_each_entry(t, &pn->pktgen_threads, th_list)
3178 		t->control |= (T_RUN);
3179 
3180 	mutex_unlock(&pktgen_thread_lock);
3181 
3182 	/* Propagate thread->control  */
3183 	schedule_timeout_interruptible(msecs_to_jiffies(125));
3184 
3185 	pktgen_wait_all_threads_run(pn);
3186 }
3187 
3188 static void pktgen_reset_all_threads(struct pktgen_net *pn)
3189 {
3190 	struct pktgen_thread *t;
3191 
3192 	func_enter();
3193 
3194 	mutex_lock(&pktgen_thread_lock);
3195 
3196 	list_for_each_entry(t, &pn->pktgen_threads, th_list)
3197 		t->control |= (T_REMDEVALL);
3198 
3199 	mutex_unlock(&pktgen_thread_lock);
3200 
3201 	/* Propagate thread->control  */
3202 	schedule_timeout_interruptible(msecs_to_jiffies(125));
3203 
3204 	pktgen_wait_all_threads_run(pn);
3205 }
3206 
3207 static void show_results(struct pktgen_dev *pkt_dev, int nr_frags)
3208 {
3209 	__u64 bps, mbps, pps;
3210 	char *p = pkt_dev->result;
3211 	ktime_t elapsed = ktime_sub(pkt_dev->stopped_at,
3212 				    pkt_dev->started_at);
3213 	ktime_t idle = ns_to_ktime(pkt_dev->idle_acc);
3214 
3215 	p += sprintf(p, "OK: %llu(c%llu+d%llu) usec, %llu (%dbyte,%dfrags)\n",
3216 		     (unsigned long long)ktime_to_us(elapsed),
3217 		     (unsigned long long)ktime_to_us(ktime_sub(elapsed, idle)),
3218 		     (unsigned long long)ktime_to_us(idle),
3219 		     (unsigned long long)pkt_dev->sofar,
3220 		     pkt_dev->cur_pkt_size, nr_frags);
3221 
3222 	pps = div64_u64(pkt_dev->sofar * NSEC_PER_SEC,
3223 			ktime_to_ns(elapsed));
3224 
3225 	bps = pps * 8 * pkt_dev->cur_pkt_size;
3226 
3227 	mbps = bps;
3228 	do_div(mbps, 1000000);
3229 	p += sprintf(p, "  %llupps %lluMb/sec (%llubps) errors: %llu",
3230 		     (unsigned long long)pps,
3231 		     (unsigned long long)mbps,
3232 		     (unsigned long long)bps,
3233 		     (unsigned long long)pkt_dev->errors);
3234 }
3235 
3236 /* Set stopped-at timer, remove from running list, do counters & statistics */
3237 static int pktgen_stop_device(struct pktgen_dev *pkt_dev)
3238 {
3239 	int nr_frags = pkt_dev->skb ? skb_shinfo(pkt_dev->skb)->nr_frags : -1;
3240 
3241 	if (!pkt_dev->running) {
3242 		pr_warn("interface: %s is already stopped\n",
3243 			pkt_dev->odevname);
3244 		return -EINVAL;
3245 	}
3246 
3247 	pkt_dev->running = 0;
3248 	kfree_skb(pkt_dev->skb);
3249 	pkt_dev->skb = NULL;
3250 	pkt_dev->stopped_at = ktime_get();
3251 
3252 	show_results(pkt_dev, nr_frags);
3253 
3254 	return 0;
3255 }
3256 
3257 static struct pktgen_dev *next_to_run(struct pktgen_thread *t)
3258 {
3259 	struct pktgen_dev *pkt_dev, *best = NULL;
3260 
3261 	rcu_read_lock();
3262 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list) {
3263 		if (!pkt_dev->running)
3264 			continue;
3265 		if (best == NULL)
3266 			best = pkt_dev;
3267 		else if (ktime_compare(pkt_dev->next_tx, best->next_tx) < 0)
3268 			best = pkt_dev;
3269 	}
3270 	rcu_read_unlock();
3271 
3272 	return best;
3273 }
3274 
3275 static void pktgen_stop(struct pktgen_thread *t)
3276 {
3277 	struct pktgen_dev *pkt_dev;
3278 
3279 	func_enter();
3280 
3281 	rcu_read_lock();
3282 
3283 	list_for_each_entry_rcu(pkt_dev, &t->if_list, list) {
3284 		pktgen_stop_device(pkt_dev);
3285 	}
3286 
3287 	rcu_read_unlock();
3288 }
3289 
3290 /*
3291  * one of our devices needs to be removed - find it
3292  * and remove it
3293  */
3294 static void pktgen_rem_one_if(struct pktgen_thread *t)
3295 {
3296 	struct list_head *q, *n;
3297 	struct pktgen_dev *cur;
3298 
3299 	func_enter();
3300 
3301 	list_for_each_safe(q, n, &t->if_list) {
3302 		cur = list_entry(q, struct pktgen_dev, list);
3303 
3304 		if (!cur->removal_mark)
3305 			continue;
3306 
3307 		kfree_skb(cur->skb);
3308 		cur->skb = NULL;
3309 
3310 		pktgen_remove_device(t, cur);
3311 
3312 		break;
3313 	}
3314 }
3315 
3316 static void pktgen_rem_all_ifs(struct pktgen_thread *t)
3317 {
3318 	struct list_head *q, *n;
3319 	struct pktgen_dev *cur;
3320 
3321 	func_enter();
3322 
3323 	/* Remove all devices, free mem */
3324 
3325 	list_for_each_safe(q, n, &t->if_list) {
3326 		cur = list_entry(q, struct pktgen_dev, list);
3327 
3328 		kfree_skb(cur->skb);
3329 		cur->skb = NULL;
3330 
3331 		pktgen_remove_device(t, cur);
3332 	}
3333 }
3334 
3335 static void pktgen_rem_thread(struct pktgen_thread *t)
3336 {
3337 	/* Remove from the thread list */
3338 	remove_proc_entry(t->tsk->comm, t->net->proc_dir);
3339 }
3340 
3341 static void pktgen_resched(struct pktgen_dev *pkt_dev)
3342 {
3343 	ktime_t idle_start = ktime_get();
3344 	schedule();
3345 	pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_get(), idle_start));
3346 }
3347 
3348 static void pktgen_wait_for_skb(struct pktgen_dev *pkt_dev)
3349 {
3350 	ktime_t idle_start = ktime_get();
3351 
3352 	while (atomic_read(&(pkt_dev->skb->users)) != 1) {
3353 		if (signal_pending(current))
3354 			break;
3355 
3356 		if (need_resched())
3357 			pktgen_resched(pkt_dev);
3358 		else
3359 			cpu_relax();
3360 	}
3361 	pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_get(), idle_start));
3362 }
3363 
3364 static void pktgen_xmit(struct pktgen_dev *pkt_dev)
3365 {
3366 	unsigned int burst = ACCESS_ONCE(pkt_dev->burst);
3367 	struct net_device *odev = pkt_dev->odev;
3368 	struct netdev_queue *txq;
3369 	struct sk_buff *skb;
3370 	int ret;
3371 
3372 	/* If device is offline, then don't send */
3373 	if (unlikely(!netif_running(odev) || !netif_carrier_ok(odev))) {
3374 		pktgen_stop_device(pkt_dev);
3375 		return;
3376 	}
3377 
3378 	/* This is max DELAY, this has special meaning of
3379 	 * "never transmit"
3380 	 */
3381 	if (unlikely(pkt_dev->delay == ULLONG_MAX)) {
3382 		pkt_dev->next_tx = ktime_add_ns(ktime_get(), ULONG_MAX);
3383 		return;
3384 	}
3385 
3386 	/* If no skb or clone count exhausted then get new one */
3387 	if (!pkt_dev->skb || (pkt_dev->last_ok &&
3388 			      ++pkt_dev->clone_count >= pkt_dev->clone_skb)) {
3389 		/* build a new pkt */
3390 		kfree_skb(pkt_dev->skb);
3391 
3392 		pkt_dev->skb = fill_packet(odev, pkt_dev);
3393 		if (pkt_dev->skb == NULL) {
3394 			pr_err("ERROR: couldn't allocate skb in fill_packet\n");
3395 			schedule();
3396 			pkt_dev->clone_count--;	/* back out increment, OOM */
3397 			return;
3398 		}
3399 		pkt_dev->last_pkt_size = pkt_dev->skb->len;
3400 		pkt_dev->allocated_skbs++;
3401 		pkt_dev->clone_count = 0;	/* reset counter */
3402 	}
3403 
3404 	if (pkt_dev->delay && pkt_dev->last_ok)
3405 		spin(pkt_dev, pkt_dev->next_tx);
3406 
3407 	if (pkt_dev->xmit_mode == M_NETIF_RECEIVE) {
3408 		skb = pkt_dev->skb;
3409 		skb->protocol = eth_type_trans(skb, skb->dev);
3410 		atomic_add(burst, &skb->users);
3411 		local_bh_disable();
3412 		do {
3413 			ret = netif_receive_skb(skb);
3414 			if (ret == NET_RX_DROP)
3415 				pkt_dev->errors++;
3416 			pkt_dev->sofar++;
3417 			pkt_dev->seq_num++;
3418 			if (atomic_read(&skb->users) != burst) {
3419 				/* skb was queued by rps/rfs or taps,
3420 				 * so cannot reuse this skb
3421 				 */
3422 				atomic_sub(burst - 1, &skb->users);
3423 				/* get out of the loop and wait
3424 				 * until skb is consumed
3425 				 */
3426 				break;
3427 			}
3428 			/* skb was 'freed' by stack, so clean few
3429 			 * bits and reuse it
3430 			 */
3431 #ifdef CONFIG_NET_CLS_ACT
3432 			skb->tc_verd = 0; /* reset reclass/redir ttl */
3433 #endif
3434 		} while (--burst > 0);
3435 		goto out; /* Skips xmit_mode M_START_XMIT */
3436 	}
3437 
3438 	txq = skb_get_tx_queue(odev, pkt_dev->skb);
3439 
3440 	local_bh_disable();
3441 
3442 	HARD_TX_LOCK(odev, txq, smp_processor_id());
3443 
3444 	if (unlikely(netif_xmit_frozen_or_drv_stopped(txq))) {
3445 		ret = NETDEV_TX_BUSY;
3446 		pkt_dev->last_ok = 0;
3447 		goto unlock;
3448 	}
3449 	atomic_add(burst, &pkt_dev->skb->users);
3450 
3451 xmit_more:
3452 	ret = netdev_start_xmit(pkt_dev->skb, odev, txq, --burst > 0);
3453 
3454 	switch (ret) {
3455 	case NETDEV_TX_OK:
3456 		pkt_dev->last_ok = 1;
3457 		pkt_dev->sofar++;
3458 		pkt_dev->seq_num++;
3459 		pkt_dev->tx_bytes += pkt_dev->last_pkt_size;
3460 		if (burst > 0 && !netif_xmit_frozen_or_drv_stopped(txq))
3461 			goto xmit_more;
3462 		break;
3463 	case NET_XMIT_DROP:
3464 	case NET_XMIT_CN:
3465 	case NET_XMIT_POLICED:
3466 		/* skb has been consumed */
3467 		pkt_dev->errors++;
3468 		break;
3469 	default: /* Drivers are not supposed to return other values! */
3470 		net_info_ratelimited("%s xmit error: %d\n",
3471 				     pkt_dev->odevname, ret);
3472 		pkt_dev->errors++;
3473 		/* fallthru */
3474 	case NETDEV_TX_LOCKED:
3475 	case NETDEV_TX_BUSY:
3476 		/* Retry it next time */
3477 		atomic_dec(&(pkt_dev->skb->users));
3478 		pkt_dev->last_ok = 0;
3479 	}
3480 	if (unlikely(burst))
3481 		atomic_sub(burst, &pkt_dev->skb->users);
3482 unlock:
3483 	HARD_TX_UNLOCK(odev, txq);
3484 
3485 out:
3486 	local_bh_enable();
3487 
3488 	/* If pkt_dev->count is zero, then run forever */
3489 	if ((pkt_dev->count != 0) && (pkt_dev->sofar >= pkt_dev->count)) {
3490 		pktgen_wait_for_skb(pkt_dev);
3491 
3492 		/* Done with this */
3493 		pktgen_stop_device(pkt_dev);
3494 	}
3495 }
3496 
3497 /*
3498  * Main loop of the thread goes here
3499  */
3500 
3501 static int pktgen_thread_worker(void *arg)
3502 {
3503 	DEFINE_WAIT(wait);
3504 	struct pktgen_thread *t = arg;
3505 	struct pktgen_dev *pkt_dev = NULL;
3506 	int cpu = t->cpu;
3507 
3508 	BUG_ON(smp_processor_id() != cpu);
3509 
3510 	init_waitqueue_head(&t->queue);
3511 	complete(&t->start_done);
3512 
3513 	pr_debug("starting pktgen/%d:  pid=%d\n", cpu, task_pid_nr(current));
3514 
3515 	set_freezable();
3516 
3517 	__set_current_state(TASK_RUNNING);
3518 
3519 	while (!kthread_should_stop()) {
3520 		pkt_dev = next_to_run(t);
3521 
3522 		if (unlikely(!pkt_dev && t->control == 0)) {
3523 			if (t->net->pktgen_exiting)
3524 				break;
3525 			wait_event_interruptible_timeout(t->queue,
3526 							 t->control != 0,
3527 							 HZ/10);
3528 			try_to_freeze();
3529 			continue;
3530 		}
3531 
3532 		if (likely(pkt_dev)) {
3533 			pktgen_xmit(pkt_dev);
3534 
3535 			if (need_resched())
3536 				pktgen_resched(pkt_dev);
3537 			else
3538 				cpu_relax();
3539 		}
3540 
3541 		if (t->control & T_STOP) {
3542 			pktgen_stop(t);
3543 			t->control &= ~(T_STOP);
3544 		}
3545 
3546 		if (t->control & T_RUN) {
3547 			pktgen_run(t);
3548 			t->control &= ~(T_RUN);
3549 		}
3550 
3551 		if (t->control & T_REMDEVALL) {
3552 			pktgen_rem_all_ifs(t);
3553 			t->control &= ~(T_REMDEVALL);
3554 		}
3555 
3556 		if (t->control & T_REMDEV) {
3557 			pktgen_rem_one_if(t);
3558 			t->control &= ~(T_REMDEV);
3559 		}
3560 
3561 		try_to_freeze();
3562 	}
3563 	set_current_state(TASK_INTERRUPTIBLE);
3564 
3565 	pr_debug("%s stopping all device\n", t->tsk->comm);
3566 	pktgen_stop(t);
3567 
3568 	pr_debug("%s removing all device\n", t->tsk->comm);
3569 	pktgen_rem_all_ifs(t);
3570 
3571 	pr_debug("%s removing thread\n", t->tsk->comm);
3572 	pktgen_rem_thread(t);
3573 
3574 	return 0;
3575 }
3576 
3577 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
3578 					  const char *ifname, bool exact)
3579 {
3580 	struct pktgen_dev *p, *pkt_dev = NULL;
3581 	size_t len = strlen(ifname);
3582 
3583 	rcu_read_lock();
3584 	list_for_each_entry_rcu(p, &t->if_list, list)
3585 		if (strncmp(p->odevname, ifname, len) == 0) {
3586 			if (p->odevname[len]) {
3587 				if (exact || p->odevname[len] != '@')
3588 					continue;
3589 			}
3590 			pkt_dev = p;
3591 			break;
3592 		}
3593 
3594 	rcu_read_unlock();
3595 	pr_debug("find_dev(%s) returning %p\n", ifname, pkt_dev);
3596 	return pkt_dev;
3597 }
3598 
3599 /*
3600  * Adds a dev at front of if_list.
3601  */
3602 
3603 static int add_dev_to_thread(struct pktgen_thread *t,
3604 			     struct pktgen_dev *pkt_dev)
3605 {
3606 	int rv = 0;
3607 
3608 	/* This function cannot be called concurrently, as its called
3609 	 * under pktgen_thread_lock mutex, but it can run from
3610 	 * userspace on another CPU than the kthread.  The if_lock()
3611 	 * is used here to sync with concurrent instances of
3612 	 * _rem_dev_from_if_list() invoked via kthread, which is also
3613 	 * updating the if_list */
3614 	if_lock(t);
3615 
3616 	if (pkt_dev->pg_thread) {
3617 		pr_err("ERROR: already assigned to a thread\n");
3618 		rv = -EBUSY;
3619 		goto out;
3620 	}
3621 
3622 	pkt_dev->running = 0;
3623 	pkt_dev->pg_thread = t;
3624 	list_add_rcu(&pkt_dev->list, &t->if_list);
3625 
3626 out:
3627 	if_unlock(t);
3628 	return rv;
3629 }
3630 
3631 /* Called under thread lock */
3632 
3633 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname)
3634 {
3635 	struct pktgen_dev *pkt_dev;
3636 	int err;
3637 	int node = cpu_to_node(t->cpu);
3638 
3639 	/* We don't allow a device to be on several threads */
3640 
3641 	pkt_dev = __pktgen_NN_threads(t->net, ifname, FIND);
3642 	if (pkt_dev) {
3643 		pr_err("ERROR: interface already used\n");
3644 		return -EBUSY;
3645 	}
3646 
3647 	pkt_dev = kzalloc_node(sizeof(struct pktgen_dev), GFP_KERNEL, node);
3648 	if (!pkt_dev)
3649 		return -ENOMEM;
3650 
3651 	strcpy(pkt_dev->odevname, ifname);
3652 	pkt_dev->flows = vzalloc_node(MAX_CFLOWS * sizeof(struct flow_state),
3653 				      node);
3654 	if (pkt_dev->flows == NULL) {
3655 		kfree(pkt_dev);
3656 		return -ENOMEM;
3657 	}
3658 
3659 	pkt_dev->removal_mark = 0;
3660 	pkt_dev->nfrags = 0;
3661 	pkt_dev->delay = pg_delay_d;
3662 	pkt_dev->count = pg_count_d;
3663 	pkt_dev->sofar = 0;
3664 	pkt_dev->udp_src_min = 9;	/* sink port */
3665 	pkt_dev->udp_src_max = 9;
3666 	pkt_dev->udp_dst_min = 9;
3667 	pkt_dev->udp_dst_max = 9;
3668 	pkt_dev->vlan_p = 0;
3669 	pkt_dev->vlan_cfi = 0;
3670 	pkt_dev->vlan_id = 0xffff;
3671 	pkt_dev->svlan_p = 0;
3672 	pkt_dev->svlan_cfi = 0;
3673 	pkt_dev->svlan_id = 0xffff;
3674 	pkt_dev->burst = 1;
3675 	pkt_dev->node = -1;
3676 
3677 	err = pktgen_setup_dev(t->net, pkt_dev, ifname);
3678 	if (err)
3679 		goto out1;
3680 	if (pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)
3681 		pkt_dev->clone_skb = pg_clone_skb_d;
3682 
3683 	pkt_dev->entry = proc_create_data(ifname, 0600, t->net->proc_dir,
3684 					  &pktgen_if_fops, pkt_dev);
3685 	if (!pkt_dev->entry) {
3686 		pr_err("cannot create %s/%s procfs entry\n",
3687 		       PG_PROC_DIR, ifname);
3688 		err = -EINVAL;
3689 		goto out2;
3690 	}
3691 #ifdef CONFIG_XFRM
3692 	pkt_dev->ipsmode = XFRM_MODE_TRANSPORT;
3693 	pkt_dev->ipsproto = IPPROTO_ESP;
3694 
3695 	/* xfrm tunnel mode needs additional dst to extract outter
3696 	 * ip header protocol/ttl/id field, here creat a phony one.
3697 	 * instead of looking for a valid rt, which definitely hurting
3698 	 * performance under such circumstance.
3699 	 */
3700 	pkt_dev->dstops.family = AF_INET;
3701 	pkt_dev->dst.dev = pkt_dev->odev;
3702 	dst_init_metrics(&pkt_dev->dst, pktgen_dst_metrics, false);
3703 	pkt_dev->dst.child = &pkt_dev->dst;
3704 	pkt_dev->dst.ops = &pkt_dev->dstops;
3705 #endif
3706 
3707 	return add_dev_to_thread(t, pkt_dev);
3708 out2:
3709 	dev_put(pkt_dev->odev);
3710 out1:
3711 #ifdef CONFIG_XFRM
3712 	free_SAs(pkt_dev);
3713 #endif
3714 	vfree(pkt_dev->flows);
3715 	kfree(pkt_dev);
3716 	return err;
3717 }
3718 
3719 static int __net_init pktgen_create_thread(int cpu, struct pktgen_net *pn)
3720 {
3721 	struct pktgen_thread *t;
3722 	struct proc_dir_entry *pe;
3723 	struct task_struct *p;
3724 
3725 	t = kzalloc_node(sizeof(struct pktgen_thread), GFP_KERNEL,
3726 			 cpu_to_node(cpu));
3727 	if (!t) {
3728 		pr_err("ERROR: out of memory, can't create new thread\n");
3729 		return -ENOMEM;
3730 	}
3731 
3732 	spin_lock_init(&t->if_lock);
3733 	t->cpu = cpu;
3734 
3735 	INIT_LIST_HEAD(&t->if_list);
3736 
3737 	list_add_tail(&t->th_list, &pn->pktgen_threads);
3738 	init_completion(&t->start_done);
3739 
3740 	p = kthread_create_on_node(pktgen_thread_worker,
3741 				   t,
3742 				   cpu_to_node(cpu),
3743 				   "kpktgend_%d", cpu);
3744 	if (IS_ERR(p)) {
3745 		pr_err("kernel_thread() failed for cpu %d\n", t->cpu);
3746 		list_del(&t->th_list);
3747 		kfree(t);
3748 		return PTR_ERR(p);
3749 	}
3750 	kthread_bind(p, cpu);
3751 	t->tsk = p;
3752 
3753 	pe = proc_create_data(t->tsk->comm, 0600, pn->proc_dir,
3754 			      &pktgen_thread_fops, t);
3755 	if (!pe) {
3756 		pr_err("cannot create %s/%s procfs entry\n",
3757 		       PG_PROC_DIR, t->tsk->comm);
3758 		kthread_stop(p);
3759 		list_del(&t->th_list);
3760 		kfree(t);
3761 		return -EINVAL;
3762 	}
3763 
3764 	t->net = pn;
3765 	get_task_struct(p);
3766 	wake_up_process(p);
3767 	wait_for_completion(&t->start_done);
3768 
3769 	return 0;
3770 }
3771 
3772 /*
3773  * Removes a device from the thread if_list.
3774  */
3775 static void _rem_dev_from_if_list(struct pktgen_thread *t,
3776 				  struct pktgen_dev *pkt_dev)
3777 {
3778 	struct list_head *q, *n;
3779 	struct pktgen_dev *p;
3780 
3781 	if_lock(t);
3782 	list_for_each_safe(q, n, &t->if_list) {
3783 		p = list_entry(q, struct pktgen_dev, list);
3784 		if (p == pkt_dev)
3785 			list_del_rcu(&p->list);
3786 	}
3787 	if_unlock(t);
3788 }
3789 
3790 static int pktgen_remove_device(struct pktgen_thread *t,
3791 				struct pktgen_dev *pkt_dev)
3792 {
3793 	pr_debug("remove_device pkt_dev=%p\n", pkt_dev);
3794 
3795 	if (pkt_dev->running) {
3796 		pr_warn("WARNING: trying to remove a running interface, stopping it now\n");
3797 		pktgen_stop_device(pkt_dev);
3798 	}
3799 
3800 	/* Dis-associate from the interface */
3801 
3802 	if (pkt_dev->odev) {
3803 		dev_put(pkt_dev->odev);
3804 		pkt_dev->odev = NULL;
3805 	}
3806 
3807 	/* Remove proc before if_list entry, because add_device uses
3808 	 * list to determine if interface already exist, avoid race
3809 	 * with proc_create_data() */
3810 	proc_remove(pkt_dev->entry);
3811 
3812 	/* And update the thread if_list */
3813 	_rem_dev_from_if_list(t, pkt_dev);
3814 
3815 #ifdef CONFIG_XFRM
3816 	free_SAs(pkt_dev);
3817 #endif
3818 	vfree(pkt_dev->flows);
3819 	if (pkt_dev->page)
3820 		put_page(pkt_dev->page);
3821 	kfree_rcu(pkt_dev, rcu);
3822 	return 0;
3823 }
3824 
3825 static int __net_init pg_net_init(struct net *net)
3826 {
3827 	struct pktgen_net *pn = net_generic(net, pg_net_id);
3828 	struct proc_dir_entry *pe;
3829 	int cpu, ret = 0;
3830 
3831 	pn->net = net;
3832 	INIT_LIST_HEAD(&pn->pktgen_threads);
3833 	pn->pktgen_exiting = false;
3834 	pn->proc_dir = proc_mkdir(PG_PROC_DIR, pn->net->proc_net);
3835 	if (!pn->proc_dir) {
3836 		pr_warn("cannot create /proc/net/%s\n", PG_PROC_DIR);
3837 		return -ENODEV;
3838 	}
3839 	pe = proc_create(PGCTRL, 0600, pn->proc_dir, &pktgen_fops);
3840 	if (pe == NULL) {
3841 		pr_err("cannot create %s procfs entry\n", PGCTRL);
3842 		ret = -EINVAL;
3843 		goto remove;
3844 	}
3845 
3846 	for_each_online_cpu(cpu) {
3847 		int err;
3848 
3849 		err = pktgen_create_thread(cpu, pn);
3850 		if (err)
3851 			pr_warn("Cannot create thread for cpu %d (%d)\n",
3852 				   cpu, err);
3853 	}
3854 
3855 	if (list_empty(&pn->pktgen_threads)) {
3856 		pr_err("Initialization failed for all threads\n");
3857 		ret = -ENODEV;
3858 		goto remove_entry;
3859 	}
3860 
3861 	return 0;
3862 
3863 remove_entry:
3864 	remove_proc_entry(PGCTRL, pn->proc_dir);
3865 remove:
3866 	remove_proc_entry(PG_PROC_DIR, pn->net->proc_net);
3867 	return ret;
3868 }
3869 
3870 static void __net_exit pg_net_exit(struct net *net)
3871 {
3872 	struct pktgen_net *pn = net_generic(net, pg_net_id);
3873 	struct pktgen_thread *t;
3874 	struct list_head *q, *n;
3875 	LIST_HEAD(list);
3876 
3877 	/* Stop all interfaces & threads */
3878 	pn->pktgen_exiting = true;
3879 
3880 	mutex_lock(&pktgen_thread_lock);
3881 	list_splice_init(&pn->pktgen_threads, &list);
3882 	mutex_unlock(&pktgen_thread_lock);
3883 
3884 	list_for_each_safe(q, n, &list) {
3885 		t = list_entry(q, struct pktgen_thread, th_list);
3886 		list_del(&t->th_list);
3887 		kthread_stop(t->tsk);
3888 		put_task_struct(t->tsk);
3889 		kfree(t);
3890 	}
3891 
3892 	remove_proc_entry(PGCTRL, pn->proc_dir);
3893 	remove_proc_entry(PG_PROC_DIR, pn->net->proc_net);
3894 }
3895 
3896 static struct pernet_operations pg_net_ops = {
3897 	.init = pg_net_init,
3898 	.exit = pg_net_exit,
3899 	.id   = &pg_net_id,
3900 	.size = sizeof(struct pktgen_net),
3901 };
3902 
3903 static int __init pg_init(void)
3904 {
3905 	int ret = 0;
3906 
3907 	pr_info("%s", version);
3908 	ret = register_pernet_subsys(&pg_net_ops);
3909 	if (ret)
3910 		return ret;
3911 	ret = register_netdevice_notifier(&pktgen_notifier_block);
3912 	if (ret)
3913 		unregister_pernet_subsys(&pg_net_ops);
3914 
3915 	return ret;
3916 }
3917 
3918 static void __exit pg_cleanup(void)
3919 {
3920 	unregister_netdevice_notifier(&pktgen_notifier_block);
3921 	unregister_pernet_subsys(&pg_net_ops);
3922 	/* Don't need rcu_barrier() due to use of kfree_rcu() */
3923 }
3924 
3925 module_init(pg_init);
3926 module_exit(pg_cleanup);
3927 
3928 MODULE_AUTHOR("Robert Olsson <robert.olsson@its.uu.se>");
3929 MODULE_DESCRIPTION("Packet Generator tool");
3930 MODULE_LICENSE("GPL");
3931 MODULE_VERSION(VERSION);
3932 module_param(pg_count_d, int, 0);
3933 MODULE_PARM_DESC(pg_count_d, "Default number of packets to inject");
3934 module_param(pg_delay_d, int, 0);
3935 MODULE_PARM_DESC(pg_delay_d, "Default delay between packets (nanoseconds)");
3936 module_param(pg_clone_skb_d, int, 0);
3937 MODULE_PARM_DESC(pg_clone_skb_d, "Default number of copies of the same packet");
3938 module_param(debug, int, 0);
3939 MODULE_PARM_DESC(debug, "Enable debugging of pktgen module");
3940